ElasticSearch筆記-5.X版本若干變化

阿新 • • 發佈：2019-01-11

寫在前面：去年寫的有關Elastic的一些知識是基於2.x版本的，目前最新的版本是5.6（2017-10），一些重要的API與用法已經發生改變。這篇文章在之前系列的基礎上，重點從API角度講講變化的部分。

一、對映的變化

string型別變為為text/keyword

變化最大的是ES的基本型別string。目前string型別已標為廢棄的，取而代之的變成了 text/keyword。text表示全文分析的string（即之前預設的string），keyword為不經分析的string(即not_analyzed的string)。

目前預設的字串對映為

{
  "type": "text" 
,
  "fields": {
    "keyword": {
      "type": "keyword",
      "ignore_above": 256
    }
  }
}

即表明預設的字串型別為分詞的，可進行全文搜尋等；其子關鍵字欄位是未分析的，可進行精確查詢、聚合及排序等。

如有個欄位名為title為字串型別。自動對映後，title可用於全文搜尋，而title.keyword欄位可進行聚合、排序等操作。

二、document API 變化

為演示方便，這裡往ES新增一些資料。

POST /cars/sale/_bulk

{ "index": {} 
}
{ "price" : 10000, "color" : "red", "make" : "honda", "sold" : "2014-10-28" }
{ "index": {}}
{ "price" : 20000, "color" : "red", "make" : "honda", "sold" : "2014-11-05" }
{ "index": {}}
{ "price" : 30000, "color" : "green", "make" : "ford", "sold" : "2014-05-18" }
{ "index": {}}
{ "price" : 15000, "color" : "blue", "make 
" : "toyota", "sold" : "2014-07-02" }
{ "index": {}}
{ "price" : 12000, "color" : "green", "make" : "toyota", "sold" : "2014-08-19" }
{ "index": {}}
{ "price" : 20000, "color" : "red", "make" : "honda", "sold" : "2014-11-05" }
{ "index": {}}
{ "price" : 80000, "color" : "red", "make" : "bmw", "sold" : "2014-01-01" }
{ "index": {}}
{ "price" : 25000, "color" : "blue", "make" : "ford", "sold" : "2014-02-12" }

現在我們有了關於汽車銷售的有關資料。

_update_by_query

5.x版本ES添加了_update_by_queryAPI，可以根據查詢到的結果進行更新。

目前我們有個需求是，所有福特（ford）汽車決定降價1000元。這正好可以使用_update_by_query完成。

POST /cars/sale/_update_by_query

{
    "query":{
        "term":{
            "make":"ford"
        }   
    },
    "script":{
        "inline":"ctx._source.price=ctx._source.price-1000",
        "lang":"painless" ①
    }
}

① painless為ES最新預設的指令碼語言，相關資料可參考painless指令碼語言。

_delete_by_query

_delete_by_query與上面提到的_update_by_query類似。它是根據查詢刪除某些文件。繼續上面的示例。

刪除所有寶馬（bmw）車系。

POST /cars/sale/_delete_by_query

{
    "query":{
        "term":{
            "make":"bmw"
        }   
    }
}

reindex

_reindex 功能為將文件從一個索引複製到另一個索引。利用它可以實現資料索引級別的無痛遷移，其中重要的是，在遷移時我們可以改變目標索引的某些欄位型別。即平滑地升級我們的索引型別。

在我們的資料中，color和make都是text型別，意味著可用於全文檢索，可在實際應用中，我們總是需要精確匹配他們，沒必要分詞，而ES的欄位型別一旦確定又無法修改。

之前的做法是重建一個索引，然後利用_bulk 把資料批量匯入新索引中。現在利用_reindex,可以實現一步匯入。

首先需要重建一個索引，設定為需要的型別。

PUT /cars_new

{
     "mappings": {
            "sale": {
                "properties": {
                    "color": {
                        "type": "keyword"
                    },
                    "make": {
                        "type": "keyword"
                    },
                    "price": {
                        "type": "integer"
                    },
                    "sold": {
                        "type": "date"
                    }
                }
            }
     }
}

新索引cars_new的color和make為keyword型別,price修改為了integer型別（之前為long）。

使用_reindex遷移索引。

POST　/_reindex

{
    "source":{
        "index":"cars"
    },
    "dest":{
        "index":"cars_new"
    }
}

檢視新索引cars_new確實建立成功，檢視cars_new對映。

GET /cars_new/_mappings/

{
    "cars_new": {
        "mappings": {
            "sale": {
                "properties": {
                    "color": {
                        "type": "keyword"
                    },
                    "make": {
                        "type": "keyword"
                    },
                    "price": {
                        "type": "integer"
                    },
                    "sold": {
                        "type": "date"
                    }
                }
            }
        }
    }
}

關於過濾 filtered

目前過濾的API已經不支援filtered的語法了。實現過濾使用constant_score或在bool子句下filter實現。這兩者都不會計算文件得分，使查詢更高效。

如只獲取綠色的汽車

POST /cars_new/sale/_search

{
    "query":{
        "constant_score":{
            "filter":{
                "term":{
                    "color":"green"
                }
            }
        }
    }
}

或

{
    "query":{
        "bool":{
            "filter":{
                "term":{
                    "color":"green"
                }
            }
        }
    }
}

一般bool 下的過濾往往結合其他查詢進行，若只有一個過濾，使用constant_score即可，它會將每個文件的評分都置為1。

三、其他變化

5.x中取消了search_type = count語法，使用 size:0的方式來代替。
添加了profileAPI，可以獲取具體在查詢時過濾，使可以有目的性的優化。

ElasticSearch筆記-5.X版本若干變化

一、對映的變化

string型別變為為text/keyword

二、document API 變化

_update_by_query

_delete_by_query

reindex

關於過濾 filtered

三、其他變化

參考文章

ElasticSearch筆記-5.X版本若干變化

Elasticsearch寫一致性在5.x版本之後已經被廢棄掉

docker 安裝ElasticSearch（2.x版本）

docker 安裝ElasticSearch（6.x版本）

徹底解決Spring Boot1.5.X版本不支援Velocity模板引擎的方法

MySQL 5.5.X版本GROUP BY錯誤解決方法

Elasticsearch筆記三之版本控制和外掛

Elasticsearch Java Client 版本區別及起步(5.X 和6.X)

（一）elasticsearch-5.x安裝與配置

[Unity3D 版本5.X]實現一個跟隨攝像機，聚焦到客戶端主角身上

ELK學習筆記(一)---安裝ELK 5.x版

Elasticsearch 5.X 使用 Docker 運行使用 Head 插件

ArcGIS API for JavaScript3.x 學習筆記[5] 加載底圖（四）【高德在線地圖】

CentOS 6 ElasticSearch 5.5.x 安裝指南

spring boot 2.X 集成 Elasticsearch 5.x 實戰增刪改查

CentOS7 下安裝 ElasticSearch 5.x 及填坑

elasticsearch 5.x 系列之六文檔索引，更新，查詢，刪除流程

解決中文輸入 Qt 針對5.8也做了說明及4.x版本

elasticsearch 5 0 版本安裝head外掛

ElasticSearch常見錯誤整理 5.5.x

ElasticSearch筆記-5.X版本若干變化

一、對映的變化

string型別變為為text/keyword

二、document API 變化

_update_by_query

_delete_by_query

reindex

關於過濾 filtered

三、其他變化

參考文章

相關推薦