1. 程式人生 > >ElasticSearch安裝中文分詞外掛smartcn

ElasticSearch安裝中文分詞外掛smartcn

elasticsearch安裝中文分詞器外掛smartcn
elasticsearch預設分詞器比較坑,中文的話,直接分詞成單個漢字。
我們這裡來介紹下smartcn外掛,這個是官方推薦的,中科院搞的,基本能滿足需求;
還有另外一個IK分詞器。假如需要自定義詞庫的話,那就去搞下IK,主頁地址:https://github.com/medcl/elasticsearch-analysis-ik
smartcn安裝比較方便,
直接用 elasticsearch的bin目錄下的plugin命令;
先進入elasticsearch的bin目錄
然後執行 sh elasticsearch-plugin install analysis-smartcn
-> Downloading analysis-smartcn from elastic
[=================================================] 100%   
-> Installed analysis-smartcn
下載 自動安裝;
(注意,假如叢集是3個節點,所有節點都需要安裝;不過一般都是先一個節點安裝好所有的東西,然後克隆幾個節點,這樣方便)


安裝後 plugins目錄會多一個smartcn檔案包;
安裝後,我們需要重啟es;
然後我們來測試下;
POST http://192.168.1.111:9200/_analyze/ 
{"analyzer":"standard","text":"我是中國人"}  
執行標準分詞器;
結果:
ElasticSearch安裝中文分詞外掛smartcn

中文都是單個字了;
很不符合需求;
我們用下 smartcn;
{"analyzer":"smartcn","text":"我是中國人"}

執行結果:
ElasticSearch安裝中文分詞外掛smartcn

我們發現 中國 程式設計個單個詞彙;