1. 程式人生 > >elasticsearch ik分詞實現 中文、拼音、同義詞搜尋

elasticsearch ik分詞實現 中文、拼音、同義詞搜尋

EasticSearch版本:1.5.2

  2.1、在elasticsearch的plugins目錄下,新建analysis-pinyin資料夾,解壓上述壓縮包,將裡面的

  

放到analysis-pinyin資料夾。

  2.2同時在elasticsearch.yml裡面配置好拼音分詞器的過濾器


3、同義詞分詞器配置:

  3.1、在elasticsearch.yml裡面配置好同義詞分詞器的過濾器


  3.2、配置同義詞詞庫,在elasticsearch的config目錄下新建sysnonym.txt。

4、配置ik+pinying+同義詞的分詞器:

index:
  analysis:
    analyzer:
      ik:
        alias: [news_analyzer_ik,ik_analyzer]
        type: org.elasticsearch.index.analysis.IkAnalyzerProvider
      ik_analyzer_pinyin:
        type: custom
        tokenizer: ik
        filter: [synonym_test_filter,pinyin_mcl]
    filter:
      synonym_test_filter:
        type: synonym_filter
        synonyms_path: synonym.txt
        dynamic_reload: true
        reload_interval: 10s
        expand: true
      pinyin_mcl:
        type: pinyin
        first_letter: none
        padding_char: ""

分詞器配置說明:
ik_analyzer_pinyin:                                //分詞器的名稱
        type: custom                               //型別:custom 表示自己定製
        tokenizer: ik                              //分割詞元的元件:這裡使用的是IK
        filter: [synonym_test_filter,pinyin_mcl]   //對分割的次元做處理:這裡使用的是拼音和同義詞

相關推薦

elasticsearch ik實現 中文拼音同義詞搜尋

EasticSearch版本:1.5.2   2.1、在elasticsearch的plugins目錄下,新建analysis-pinyin資料夾,解壓上述壓縮包,將裡面的    放到analys

使用 Elasticsearch ik實現同義詞搜尋

1、首先需要安裝好Elasticsearch 和elasticsearch-analysis-ik分詞器 2、配置ik同義詞 Elasticsearch 自帶一個名為 synonym 的同義詞 filter。為了能讓 IK 和 synonym 同時工作,我們需要定義新的

Elasticsearch-IK器詳解以及原始碼修改實現mysql熱更新

IK分詞器的安裝和使用 訪問ik分詞器github專案地址:https://github.com/medcl/elasticsearch-analysis-ik 1.在本地clone專案程式碼,git clone https://github.com/me

lucene6.6+拼音+ik實現

原來專案使用的是solr進行建立索引與查詢,最近想改為lucene。對於最新版的lucene網上的資料沒有solr多,並且solr很多功能直接配置就可以使用,但是lucene都要通過api進行封裝使用。下面是自己使用lucene6.6+拼音分詞和ik中文分詞實現的功能:

Elasticsearch ik器修改原始碼實現從mysql中定時更新詞庫

下載原始碼匯入eclispe請參考我的上一篇文章ik分詞器安裝 第一步 修改pom檔案 加入mysql驅動jar 如圖所示 第二步 修改Java類 1.在Dictionary.java檔案中新增一個方法 /** * 批量載

ElasticSearch IK器下載

1、使用瀏覽器下載:  注意ik分詞器需要和elasticsearch版本對應,在 v6.x.x和6.x.x.zip輸入你對應的版本號,下載完之後直接解壓elasticsearch-analysis-ik-6.x.x.zip,並將解壓後的檔案目錄elasticsearc

elasticsearch ik外掛的擴充套件字典和擴充套件停止字典用法

擴充套件字典中的詞會被篩選出來,擴充套件停止詞中的詞會被過濾掉 1.沒有加入擴充套件字典 停止詞字典用法 ik [[email protected] custom]# curl -i -X GET -H 'Content-type:application/js

elasticsearch ik器安裝

環境: centos 7.2 es 6.5.3   ik下載地址: https://github.com/medcl/elasticsearch-analysis-ik/releases   線上安裝命令: cd /usr/share/ela

ElasticSearch-IK器和整合使用

## 1.查詢存在問題分析 在進行字串查詢時,我們發現去搜索"搜尋伺服器"和"鋼索"都可以搜尋到資料; 而在進行詞條查詢時,我們搜尋"搜尋"卻沒有搜尋到資料; 究其原因是ElasticSearch的標準分詞器導致的,當我們建立索引時,欄位使用的是標準分詞器: >如果使用ES搜尋中文內容,預設是不支援中文

elasticsearch 拼音+ik,spring data elasticsearch 拼音

maven打包 vat tokenizer origin emp 下載源 case remove 解壓 elasticsearch 自定義分詞器 安裝拼音分詞器、ik分詞器   拼音分詞器: https://github.com/medcl/elasticsearch-an

ElasticSearch安裝IKelasticsearch-analysis-ik)安裝

安裝jdk(一個java的jdk包,如果沒有可以私聊我微信w7752442,備註:php) rpm -ivh jdk-11_linux-x64_bin.rpm 安裝elasticsearch(安裝包地址:https://github.com/medcl/elasticsearch-ana

ElasticSearch測試IK簡單測試(PHP)

以下全是測試程式碼:如有需要了解安裝 ElasticSearch和IK分詞的可參考:https://blog.csdn.net/weixin_42579642/article/details/84317099 use Elasticsearch\ClientBuilder; cla

Elasticsearch拼音IK的安裝及使用

一、Es外掛配置及下載 1.IK分詞器的下載安裝 關於IK分詞器的介紹不再多少,一言以蔽之,IK分詞是目前使用非常廣泛分詞效果比較好的中文分詞器。做ES開發的,中文分詞十有八九使用的都是IK分詞器。 下載地址:https://github.com/medcl/elasticsearch-analysis

ElasticSearch學習筆記(二)IK器和拼音器的安裝

ElasticSearch是自帶分詞器的,但是自帶的分詞器一般就只能對英文分詞,對英文的分詞只要識別空格就好了,還是很好做的(ES的這個分詞器和Lucene的分詞器很想,是不是直接使用Lucene的就不知道),自帶的分詞器對於中文就只能分成一個字一個字,這個顯然

SpringBoot整合Elasticsearch 進階,實現[中文拼音繁簡體轉換]高階搜尋

Elasticsearch 分詞 分詞分為讀時分詞和寫時分詞。 讀時分詞發生在使用者查詢時,ES 會即時地對使用者輸入的關鍵詞進行分詞,分詞結果只存在記憶體中,當查詢結束時,分詞結果也會隨即消失。而寫時分詞發生在文件寫入時,ES 會對文件進行分詞後,將結果存入倒排索引,該部分最終會以

大資料求索(10): 解決ElasticSearch中文搜尋無結果------ik器的安裝與使用

大資料求索(10): 解決ElasticSearch中文搜尋無結果-----IK中文分詞器的安裝與使用 問題所在 在中文情況下,ES預設分詞器會將漢字切分為一個一個的漢字,所以當搜尋詞語的時候,會發現無法找到結果。 解決辦法 有很多其他的分詞器外掛可以替代,這裡使用最常用

elasticsearch 6.x 叢集佈署與headKibana和IK外掛的配置

  首先準備三臺linux伺服器,在三臺伺服器上安裝ElasticSearch.6.3,及其head、Kibana和IK分詞外掛,外掛只需安裝在其中一臺即可。elasticsearch 6.x以後變化有點的,head和Kibana,不能放在elasticsear

Elasticsearch1.x 拼音實現全拼首字母中文混合搜尋

一、外掛簡介 elasticsearch-analysis-lc-pinyin是一款elasticsearch拼音分詞外掛,可以支援按照全拼、首字母,中文混合搜尋。 首先舉個栗子說明下,我們在淘寶搜尋框中輸入“jianpan” 可以搜尋到關鍵字包含“鍵盤”的商品。不僅僅輸入

ElasticSearchik器建立索引(java API)

tle creat analyzer undefined 全文搜索 () map 多用戶 tcl   ElasticSearch是一個基於Lucene的搜索服務器。它提供了一個分布式多用戶能力的全文搜索引擎,基於RESTful web接口。Elasticsearch是用Ja

Elasticsearch入門之從零開始安裝ik

gpo article terms n) rm -rf 從零開始 系列 pack 默認 起因 需要在ES中使用聚合進行統計分析,但是聚合字段值為中文,ES的默認分詞器對於中文支持非常不友好:會把完整的中文詞語拆分為一系列獨立的漢字進行聚合,顯然這並不是我的初衷。我們來看個