1. 程式人生 > >【翻譯】SQL最近位置查詢語句(MySQL、PostgreSQL、SQL Server)

【翻譯】SQL最近位置查詢語句(MySQL、PostgreSQL、SQL Server)

部落格地址:https://thans.cn

前言

我已經浪費了太多的時間在尋找定位軟體上了,因此這值得我去寫下如何去做。當然,在地球表面計算距離意味著計算大圓距離,可以通過半正矢公式計算,也稱之為球面餘弦定律公式。問題是:

給出一個具有經緯度的位置表,其中哪個位置最靠近給出的定位?

<!--more-->

位置資料表

你是否想問在哪裡我可以找到一張具有經緯度的位置表?你可以在網際網路上搜索“郵政編碼免費下載”或者“免費郵編下載”。然後將其載入到MySQL表中。有很多不同型別的地理資料可以下載,附帶經緯度位置。

這是SQL Server資料的美國郵政編碼資料包,如果你正好需要的話。

本文中的邏輯適用於MySQL,MariaDB, PostgreSQL,和微軟的SQL Server。Oracle的工作方式有一點不同;這裡有一篇文章講述瞭如何在Oracle中實現

請慎重的使用郵政編碼資料作為確定位置的方法。郵政編碼僅被設計用於幫助優化郵政投遞。他們的資料用途有限,並且可能帶來錯誤的結果。例如,這是一篇地理學家寫的關於美國密西根州弗林特市水危機的文章。在很長一段時間,弗林特市的孩子似乎沒有鉛中毒,因為研究員只看他們家的郵政編碼去找出他們住在哪裡。但是他們鉛中毒了,別和密歇根州政府犯相同的錯誤。

煩人卻必要的地理

緯度和經度用度數表示。緯度描述了一個點在赤道以北或以南的距離。赤道上的點的緯度是零。北極的正(北)緯度為90度,並且南極是負(南)緯度-90度。相應的,北半球的位置有著正緯度,並且南半球的位置有著負的緯度。

經度描述了一個點從本初子午線向東的距離:地球表面從一個點到另一個點的任意直線。位於美國紐約市的帝國大廈的經度為負(西),具體來說為-73.9857。印度阿格拉的泰姬陵經度為正(東經),具體為78.0422。英國倫敦附近的格林威治天文臺,根據定義,經度為零。

因此,緯度是範圍內的值[-90,90]。經度是範圍(-180,180)內的值。這些值有時以度、分和秒錶示,而不是以度和小數表示。如果你打算做計算,先把分和秒轉換成小數。

在拿破崙時代,米是最早被定義的,所以從赤道到兩極有一千萬米。原來緯度上的米數是10000000/90或111.111公里。但是地球有點凸起,因此111.045公里/度被認為是一個更好的近似值。

在這裡我們為了方便計算,我們假設地球是一個球體。雖然這不是真的。它在赤道上有點凸起,但是定位問題,我們假設是球體就足夠了。

這個公式(111.045公里/度)在你向北或者向南移動的時候很好用。如果你在改變你的緯度而不是經度。如果你在向東或者向西移動、在改變你的經度、在赤道上,它也能起作用。但是在赤道的南北邊,經度線越來越接近,所以如果你向西或向東移動一個刻度,你移動的距離就會小於111.045千米。當你往東或往西走一度時,你實際移動的距離實際上是公里數。

111.045 * cos(latitude)

我們在一些英國殖民地裡使用英里。海里是指緯度的一分鐘(1/60度)。所以每度有69法定英里或每度60海里。如果你正在處理這樣的應用,如GPS控制耕牛隊,你可能會發現它有助於知道有552浪(長度單位,相當於220碼、201米或⅛英里)每度。一些以美國為中心的應用程式擾亂了經度。對西半球的位置來說,它們是正的而不是負的。如果你在除錯什麼東西,要注意這個

大圓距離公式

任意兩點沿(球面)地球表面的距離是多少?用度數表示,用他們的經緯度表示?這是由球餘弦定理,或者半正矢公式決定的。這是MySQL語法中的:

DEGREES(ACOS(COS(RADIANS(lat1)) * COS(RADIANS(lat2)) *
             COS(RADIANS(long1) - RADIANS(long2)) +
             SIN(RADIANS(lat1)) * SIN(RADIANS(lat2))))

它是地球表面的距離。當這些地方是你的公寓和當地超市,或者是澳大利亞悉尼和冰島雷克雅未克的機場時,它也同樣適用。注意,這個結果是以度為單位的。這意味著如果我們想要以公里為單位的距離,我們必須將它乘以111.045,即每度公里的數值。

請注意MS SQL Server需要使用一個float或double來表示RADIANS。RADIANS(30) 返回的是有問題的值,但是RADIANS(30)能正常工作。一般來說,MS SQL Server不會可靠的強制整integer型別的值轉換為float或者double型別,所有請小心,不要在你需要使用float的時候使用integer型別。此外,請記住美國郵政編碼雖然看起來像數字,但是其實是字串。我住的地方郵政編碼是'01950',這和1950是不一樣的

查詢最近的位置

為了在資料庫中找到與給定點的最近的點,我們可以這樣寫查詢。讓我們使用經度為-70.81、緯度為42.81的點。這個MySQL查詢按照距離的順序查詢離給定點最近的15個點。 可以在這邊測試:http://sqlfiddle.com/#!9/21e06/1

SELECT zip, primary_city, latitude, longitude,
      111.045* DEGREES(ACOS(COS(RADIANS(latpoint))
                 * COS(RADIANS(latitude))
                 * COS(RADIANS(longpoint) - RADIANS(longitude))
                 + SIN(RADIANS(latpoint))
                 * SIN(RADIANS(latitude)))) AS distance_in_km
 FROM zip
 JOIN (
     SELECT  42.81  AS latpoint,  -70.81 AS longpoint
   ) AS p ON 1=1
 ORDER BY distance_in_km
 LIMIT 15

注意使用連線將latpoint和longpoint放入查詢中。這樣編寫查詢很方便,因為公式中多次引用了latpoint和longpoint。(MySQL不需要使用ON 1=1,但是PostgreSQL需要) (在SQL Server中, 使用 SELECT TOP(15) zip … 來替換LIMIT 15.)

非常好,我們做到了,對吧?彆著急!這個查詢雖然是正確的,但是他很慢。

優化

查詢速度很慢是因為它必須為每個可能的點對計算半正矢公式。因此,它使你的MySQL伺服器做了很多數學運算,並強制它掃描整個位置表。如何優化?如果我們能在表中的緯度和經度列上使用索引,那就太好了。為此,我們引入一個約束。假設我們只關心郵政編碼表中距離(latpoint,longpoint)50公里以內的點。讓我們找出如何使用索引來消除更遠的點。

請記住,根據本文前面的背景資訊,緯度是111.045公里。所以,如果緯度列上有一個索引,我們可以使用類似這樣的SQL子句來消除太北或太南的點,這些點可能不在50公里之內。

latitude BETWEEN latpoint - (50.0 / 111.045)
             AND latpoint + (50.0 / 111.045)             

這個WHERE語句允許MySQL在計算半正矢距離公式之前使用索引省略許多緯度點。它允許MySQL對緯度索引執行範圍掃描。

最後,我們可以使用一個類似但更復雜的SQL子句來消除太東或太西的點。這個條款更復雜,因為經度是離我們移動的赤道越遠的距離越小。請看下面公式:

longitude BETWEEN longpoint - (50.0 / (111.045 * COS(RADIANS(latpoint))))
              AND longpoint + (50.0 / (111.045 * COS(RADIANS(latpoint))))

因此,將所有這些放在一起,這個查詢將查詢(latpoint,longpoint)50公里範圍內的最東邊15個點。

儘管這個查詢有點複雜,但它利用了緯度和經度索引,並且工作效率很高。

請注意,作為整個查詢的一部分,我們加入了這個子查詢。

SELECT  42.81  AS latpoint,  -70.81 AS longpoint,
        50.0 AS radius,      111.045 AS distance_unit

這樣做的目的是使應用軟體更容易提供查詢所需的引數。Latpoint和Longpoint是您需要附近位置的特定位置。radius指定搜尋應該走多遠。最後,如果你想用公里表示距離,距離單位應該是111.045。如果你想用英里表示距離,應該是69.0。

極限對角線距離

但是,這個邊界查詢有可能返回距離(latpoint,longpoint)對角線超過50km的一些點:它只檢查一個邊界矩形,而不是對角線距離。讓我們增強查詢以消除超過50公里的點。

使用英里而不是公里

最後,許多人需要用英里而不是公里來計算他們的距離。這很簡單。只需將距離單位的值更改為69.0。

這是一個基於經緯度的典型商店查詢程式或位置查詢程式的查詢。應該能夠適應你的使用,沒有太多的麻煩。

將此查詢適應其他位置表定義

當然,這個查詢是用一個特定的ZIP表定義(一個美國郵政編碼表)編寫的。該zip表包含名為zipprimary_citylatitudelongitude等欄位。請注意,該表在查詢中由 FROM zip AS z引用。所以它的別名是z

你的位置表很可能有不同的列。重寫此查詢來適應你的查詢應該很簡單。在查詢中查詢稱為z.something的欄位,並用表中的欄位名替換這些欄位。例如,如果你的表名為shop,並且有shopnameshoplatshoplong欄位,那麼你把z.shopname替換為z.primary_city,以此類推。你將通過在查詢中包含FROM SHOP as z來引用表。

原文地址:http://www.plumislandmedia.net/mysql/haversine-mysql-nearest-