地理位置geo處理之mysql函式
目前越來越多的業務都會基於LBS,附近的人,外賣位置,附近商家等等,現就討論離我最近這一業務場景的解決方案。
原文:https://www.jianshu.com/p/455d0468f6d4
目前已知解決方案有:
- mysql 自定義函式計算
- mysql geo索引
- mongodb geo索引
- postgresql PostGis索引
- redis geo
- ElasticSearch
本文測試下mysql 函式運算的效能
準備工作
建立資料表
CREATE TABLE `driver` ( `id` int(11) unsigned NOT NULL AUTO_INCREMENT, `lng` float DEFAULT NULL, `lat` float DEFAULT NULL, PRIMARY KEY (`id`) ) ENGINE=InnoDB DEFAULT CHARSET=utf8;
建立測試資料
在建立資料之前先了解下基本的地理知識:
-
全球經緯度的取值範圍為:緯度-90 90,經度-180 180
-
中國的經緯度範圍大約為:緯度3.86 53.55,經度73.66 135.05
-
北京行政中心的緯度為39.92,經度為116.46
-
越北面的地方緯度數值越大,越東面的地方經度數值越大
-
度分轉換: 將度分單位資料轉換為度單位資料,公式:度=度+分/60
-
分秒轉換: 將度分秒單位資料轉換為度單位資料,公式:度 = 度 + 分 / 60 + 秒 / 60 / 60
在緯度相等的情況下:
- 經度每隔0.00001度,距離相差約1米
在經度相等的情況下:
- 緯度每隔0.00001度,距離相差約1.1米
mysql函式計算
DELIMITER // CREATE DEFINER=`root`@`localhost` FUNCTION `getDistance`( `lng1` float(10,7) , `lat1` float(10,7) , `lng2` float(10,7) , `lat2` float(10,7) ) RETURNS double COMMENT '計算2座標點距離' BEGIN declare d double; declare radius int; set radius = 6371000; #假設地球為正球形,直徑為6371000米 set d = (2*ATAN2(SQRT(SIN((lat1-lat2)*PI()/180/2) *SIN((lat1-lat2)*PI()/180/2)+ COS(lat2*PI()/180)*COS(lat1*PI()/180) *SIN((lng1-lng2)*PI()/180/2) *SIN((lng1-lng2)*PI()/180/2)), SQRT(1-SIN((lat1-lat2)*PI()/180/2) *SIN((lat1-lat2)*PI()/180/2) +COS(lat2*PI()/180)*COS(lat1*PI()/180) *SIN((lng1-lng2)*PI()/180/2) *SIN((lng1-lng2)*PI()/180/2))))*radius; return d; END// DELIMITER ;
建立資料python指令碼
# coding=utf-8 from orator import DatabaseManager, Model import logging import random import threading """ 中國的經緯度範圍 緯度3.86~53.55,經度73.66~135.05。大概0.00001度差距1米 """ # 建立 日誌 物件 logger = logging.getLogger() handler = logging.StreamHandler() formatter = logging.Formatter( '%(asctime)s %(name)-12s %(levelname)-8s %(message)s') handler.setFormatter(formatter) logger.addHandler(handler) logger.setLevel(logging.DEBUG) # Connect to the database config = { 'mysql': { 'driver': 'mysql', 'host': 'localhost', 'database': 'dbtest', 'user': 'root', 'password': '', 'prefix': '' } } db = DatabaseManager(config) Model.set_connection_resolver(db) class Driver(Model): __table__ = 'driver' __timestamps__ = False pass def ins_driver(thread_name,nums): logger.info('開啟執行緒%s' % thread_name) for _ in range(nums): lng = '%.5f' % random.uniform(73.66, 135.05) lat = '%.5f' % random.uniform(3.86, 53.55) driver = Driver() driver.lng = lng driver.lat = lat driver.save() thread_nums = 10 for i in range(thread_nums): t = threading.Thread(target=ins_driver, args=(i, 400000)) t.start()

image.png
以上指令碼建立10個執行緒,10個執行緒插入4萬條資料。耗費150.18s執行完,總共插入40萬條資料
測試
- 測試環境
系統:mac os
記憶體:16G
cpu: intel core i5
硬碟: 500g 固態硬碟
測試下查詢距離(134.38753,18.56734)這個座標點最近的10個司機
select *,`getDistance`(134.38753,18.56734,`lng`,`lat`) as dis from driver ORDER BY dis limit 10
- 耗時:18.0s
- explain:全表掃描
我測試了從1萬到10萬間隔1萬和從10萬到90萬每間隔10萬測試的結果變化

image.png
結論
- 此方案在資料量達到3萬條查詢耗時就會超過1秒
- 大約每增加1萬條就會增加0.4秒的耗時