1. 程式人生 > >ES學習(四)拼音外掛分詞elasticsearch-analysis-pinyin

ES學習(四)拼音外掛分詞elasticsearch-analysis-pinyin

摘要:elasticsearch-analysis-pinyin是elasticsearch的一個分詞外掛,用於漢字與拼音之間的轉換。本文主要介紹該外掛的安裝和具體的使用方法。

一.安裝

1.去官網下載原始碼:https://github.com/medcl/elasticsearch-analysis-pinyin,注意找與elasticsearch對應的版本,由於使用的es是2.3.3版本,下載了v1.7.3的外掛


2.拖入至linux

    cd 到linux原始碼zip路徑,進行解壓;然後執行編譯命令:mvn clean install.編譯成功之後,你將在elasticsearch-analysis-pinyin-1.7.3/target目錄中看到elasticsearch-analysis-pinyin-1.7.3的jar包,我編譯完成之後,生成的jar包名稱為:elasticsearch-analysis-pinyin-1.7.3.jar,然後elasticsearch-analysis-pinyin-1.7.3/lib目錄中看到pinyin4j的jar包,我的jar包名稱為:pinyin4j-2.5.0.jar。

4.具體安裝

在ES_HOME目錄下建立一個plugins目錄(如果沒有的話),然後在plugins目錄下建立pinyin目錄,將前兩個步驟中得到的jar包拷貝到ES_HOME/plugins/pinyin目錄下面。ok,外掛安裝基本完成!

二:使用

1.重啟es

2.分詞測試

(1)建立索引


(2)通過瀏覽器檢視分詞效果

localhost:29200/medcl1/_analyze?text=劉德華&analyzer=pinyin_analyzer

返回結果如下,分詞成功,該外掛能夠輕易的得到中文對應的拼音分詞,然後搜尋可以對輸入的拼音提示對應的中文,提高搜尋體驗。