地理位置geo處理之mysql函式

MySQL · 發表 2018-11-02 15:40:00

摘要：目前越來越多的業務都會基於LBS，附近的人，外賣位置，附近商家等等，現就討論離我最近這一業務場景的解決方案。原文：https://www.jianshu.com/p/455d0468f6d4 目前已知解決方案有: mysql 自定義函式計算 mysql geo索引 ...

目前越來越多的業務都會基於LBS，附近的人，外賣位置，附近商家等等，現就討論離我最近這一業務場景的解決方案。

原文：https://www.jianshu.com/p/455d0468f6d4

目前已知解決方案有:

mysql 自定義函式計算
mysql geo索引
mongodb geo索引
postgresql PostGis索引
redis geo
ElasticSearch

本文測試下mysql 函式運算的效能

準備工作

建立資料表

CREATE TABLE `driver` (
`id` int(11) unsigned NOT NULL AUTO_INCREMENT,
`lng` float DEFAULT NULL,
`lat` float DEFAULT NULL,
PRIMARY KEY (`id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8;

建立測試資料

在建立資料之前先了解下基本的地理知識:

全球經緯度的取值範圍為:緯度-90 _{90，經度-180} 180
中國的經緯度範圍大約為：緯度3.86 _{53.55，經度73.66} 135.05
北京行政中心的緯度為39.92，經度為116.46
越北面的地方緯度數值越大，越東面的地方經度數值越大
度分轉換：將度分單位資料轉換為度單位資料，公式：度=度+分/60
分秒轉換：將度分秒單位資料轉換為度單位資料，公式：度 = 度 + 分 / 60 + 秒 / 60 / 60

在緯度相等的情況下：

經度每隔0.00001度，距離相差約1米

在經度相等的情況下：

緯度每隔0.00001度，距離相差約1.1米

mysql函式計算

DELIMITER //
CREATE DEFINER=`root`@`localhost` FUNCTION `getDistance`(
`lng1` float(10,7) 
,
`lat1` float(10,7)
,
`lng2` float(10,7) 
,
`lat2` float(10,7)

) RETURNS double
COMMENT '計算2座標點距離'
BEGIN
declare d double;
declare radius int;
set radius = 6371000; #假設地球為正球形，直徑為6371000米
set d = (2*ATAN2(SQRT(SIN((lat1-lat2)*PI()/180/2)
*SIN((lat1-lat2)*PI()/180/2)+
COS(lat2*PI()/180)*COS(lat1*PI()/180)
*SIN((lng1-lng2)*PI()/180/2)
*SIN((lng1-lng2)*PI()/180/2)),
SQRT(1-SIN((lat1-lat2)*PI()/180/2)
*SIN((lat1-lat2)*PI()/180/2)
+COS(lat2*PI()/180)*COS(lat1*PI()/180)
*SIN((lng1-lng2)*PI()/180/2)
*SIN((lng1-lng2)*PI()/180/2))))*radius;
return d;
END//
DELIMITER ;

建立資料python指令碼

# coding=utf-8
from orator import DatabaseManager, Model
import logging
import random
import threading

""" 中國的經緯度範圍 緯度3.86~53.55，經度73.66~135.05。大概0.00001度差距1米 """

# 建立 日誌 物件
logger = logging.getLogger()
handler = logging.StreamHandler()
formatter = logging.Formatter(
'%(asctime)s %(name)-12s %(levelname)-8s %(message)s')
handler.setFormatter(formatter)
logger.addHandler(handler)
logger.setLevel(logging.DEBUG)

# Connect to the database

config = {
'mysql': {
'driver': 'mysql',
'host': 'localhost',
'database': 'dbtest',
'user': 'root',
'password': '',
'prefix': ''
}
}

db = DatabaseManager(config)
Model.set_connection_resolver(db)


class Driver(Model):
__table__ = 'driver'
__timestamps__ = False
pass


def ins_driver(thread_name,nums):
logger.info('開啟執行緒%s' % thread_name)
for _ in range(nums):
lng = '%.5f' % random.uniform(73.66, 135.05)
lat = '%.5f' % random.uniform(3.86, 53.55)

driver = Driver()
driver.lng = lng
driver.lat = lat
driver.save()

thread_nums = 10
for i in range(thread_nums):
t = threading.Thread(target=ins_driver, args=(i, 400000))
t.start()

image.png

以上指令碼建立10個執行緒，10個執行緒插入4萬條資料。耗費150.18s執行完,總共插入40萬條資料

測試

測試環境

系統：mac os

記憶體：16G

cpu: intel core i5

硬碟: 500g 固態硬碟

測試下查詢距離(134.38753,18.56734)這個座標點最近的10個司機

select *,`getDistance`(134.38753,18.56734,`lng`,`lat`) as dis from driver ORDER BY dis limit 10

耗時：18.0s
explain:全表掃描

我測試了從1萬到10萬間隔1萬和從10萬到90萬每間隔10萬測試的結果變化