1. 程式人生 > >《TableStore最佳實踐:GEO索引打造店鋪搜索系統》

《TableStore最佳實踐:GEO索引打造店鋪搜索系統》

proc 頁面 cto get arch pro 跳轉 數據表 產品

一、方案背景
對於一套GEO管理系統,其核心點與瓶頸在於數據庫的存儲性能與查詢能力;一方面,存儲服務需要應對海量數據的低延遲存、讀,另一方面,存儲服務也要提供高效的GEO+多維度數據檢索。表格存儲(TableStore),作為一款Serverless分布式NoSQL數據庫,完全具備該系統的需求。
下面我們將基於TableStore打造一個【億量級GEO管理系統】;

需求場景
某店鋪搜索平臺,提供了億量級的店鋪信息。用戶通過平臺提供的PC端、移動端網頁,按照自己的需求維度組合,搜索用戶心儀的店鋪。平臺需要在地圖上展示店鋪的具體位置、店鋪詳細信息、店鋪主頁的跳轉;
維度一:【距離1km內】【人均100以內】【評分最高】【奶茶店】;

維度二:【杭州市內】【評分最高的】【沈家*】店鋪;
......
實現快速、多維GEO查詢功能,是GEO管理解決方案的核心功能,樣例如下:
註:該樣例提供了【億量級】店鋪數據。官網控制臺樣例地址:項目樣例

基於表格存儲搭建的店鋪搜索系統頁面一覽,樣例內嵌在表格存儲控制臺中,用戶可登錄控制臺體驗系統(若為表格存儲的新用戶,需要點擊開通服務後體驗,開通免費,訂單數據存儲在公共實例中,體驗不消耗用戶存儲、流量、Cu)。

表格存儲(TableStore)方案
使用表格存儲(TableStore)研發的多元索引(SearchIndex)方案,可以輕松搭建一套:億量級店鋪搜索系統。多元索引功能可以創建GEO索引、分詞字符串索引等,為用戶提供了GEO檢索、多維組合檢索等能力,用戶可隨時創建,存量、增量數據自動同步。

TableStore作為阿裏雲提供的一款全托管、零運維的分布式NoSql型數據存儲服務,具有【海量數據存儲】、【熱點數據自動分片】、【海量數據多維檢索】等功能,有效的地解決了GEO數據量大膨脹這一挑戰;
用戶可以僅在需要的時候創建、開通索引。由TableStore來保證數據同步的一致性,這極大的降低了用戶的方案設計、服務運維、代碼開發等工作量。

二、搭建準備
若您對於基於TableStore實現的【億量級店鋪搜索系統】體驗不錯,並希望開始自己系統的搭建之旅,只需按照如下步驟便可以著手搭建了:

1、開通表格存儲
通過控制臺開通表格存儲服務,表格存儲即開即用(後付費),采用按量付費方式,已為用戶提供足夠功能測試的免費額度。表格存儲官網控制臺、免費額度說明。

2、創建實例
通過控制臺創建表格存儲實例,選擇支持多元索引的Region。(當前階段SearchIndex功能尚未商業化,暫時開放北京,上海,杭州和深圳四地,其余地區將逐漸開放)

技術分享圖片

創建實例後,提交工單申請多元索引功能邀測(商業化後默認打開,不使用不收費)。

邀測地址:提工單,選擇【表格存儲】>【產品功能、特性咨詢】>【創建工單】,申請內容如下:
問題描述:請填寫【申請SearchIndex邀測】
機密信息:請填寫【地域+實例名】,例:上海+myInstanceName
技術分享圖片

3、SDK下載
使用具有多元索引(SearchIndex)的SDK,官網地址,暫時java、go、node.js三種SDK增加了新功能

java-SDK
<dependency>
<groupId>com.aliyun.openservices</groupId>
<artifactId>tablestore</artifactId>
<version>4.7.4</version>
</dependency>
go-SDK
$ go get github.com/aliyun/aliyun-tablestore-go-sdk
4、表設計
店鋪檢索系統樣例,僅簡易使用一張店鋪表,主要包含字段:店鋪類型、店鋪名稱、店鋪地理位置、店鋪平均評分、人均消費消等。表設計如下:
表名:geo_positon
技術分享圖片
三、開始搭建(核心代碼)
1、創建數據表
用戶僅需在完成邀測的實例下創建“店鋪信息表”:通過控制臺創建、管理數據表(用戶也可以通過SDK直接創建):

技術分享圖片

2、創建數據表索引
TableStore自動做全量、增量的索引數據同步:用戶可以通過控制臺創建索引、管理索引(也可以通過SDK創建索引)

技術分享圖片

技術分享圖片

3、數據導入
插入測試數據(控制臺樣例中插入了1億條數據,用戶自己可以插入少量測試數據);

技術分享圖片

技術分享圖片
4、數據讀取
數據讀取分為兩類:

主鍵讀取
基於原生表格存儲的主鍵列獲取:getRow, getRange, batchGetRow等。主鍵讀取用於索引(自動)反查,用戶也可以提供主鍵(訂單md5)的單條查詢的頁面,億量級下查詢速度極快。單主鍵查詢方式不支持多維度檢索;

索引讀取(店鋪查詢)
基於新SearchIndex功能Query:search接口。用戶可以自由設計索引字段的多維度條件組合查詢。通過設置選擇不同的查詢參數,構建不同的查詢條件、不同排序方式;目前支持:精確查詢、範圍查詢、前綴查詢、匹配查詢、通配符查詢、短語匹配查詢、分詞字符串查詢,並通過布爾與、或組合。
如【"36.76613,111.41461"周邊1km米範圍內的奶茶店】,查詢條件如下:

List<Query> mustQueries = new ArrayList<Query>();

TermQuery termQuery = new TermQuery();
termQuery.setFieldName("type");
termQuery.setTerm(ColumnValue.fromString(奶茶));
mustQueries.add(termQuery);

GeoDistanceQuery geoDistanceQuery = new GeoDistanceQuery();
geoDistanceQuery.setFieldName("pos");
geoDistanceQuery.setCenterPoint("36.76613,111.41461");
geoDistanceQuery.setDistanceInMeter(1000);
mustQueries.add(geoDistanceQuery);

BoolQuery boolQuery = new BoolQuery();
boolQuery.setMustQueries(mustQueries);

《TableStore最佳實踐:GEO索引打造店鋪搜索系統》