ElasticSearch-6.4.1安裝中文分詞器Analysis-ik.

阿新 • • 發佈：2018-11-09

一：使用背景和安裝過程.

1. ElasticSearch-6.4.1.(Windows環境下)

ElasticSearch預設的分詞器對中文分詞器支援不好,下面安裝中文分詞器.Linux下是一樣的安裝方式就是wget+url然後新建目錄,解壓到指定的目錄下,然後重啟ES即可.

2. 中文分詞器IKAnalyzer下載.

analysis-ik

3. 來到ElasticSearch的安裝目錄.

新建目錄:ik

4. 將剛才下載的IK解壓到ik目錄下.

5. 啟動ElasticSearch.(觀察一下啟動日誌).

6. 啟動head外掛.

7. 測試IK分詞器.(PostMan下測試)

7.1 一個刪除ES索引的測試.(自己測試的,與本文無關).

7.2 IK分詞效果有兩種,一種是ik_max_word（最大分詞）和ik_smart（最小分詞）

現在的分詞文字是：中華人名共和國港珠澳大橋建成通車.

8. REST API 使用AK分詞器.

8.1 測試最大分詞效果.

8.2 測試最小分詞效果.

二. JAVA API使用AK分詞器.

2.1 首先新建一個索引.

2.2 Java API使用分詞器.

首先是獲取TransportClient物件. 注入靜態方法中注意初始化的方式.

使用標準分詞器.

public class ElasticApplication {
    private static TransportClient client;
    @Autowired
    public void setClient(TransportClient client){
        ElasticApplication.client=client;
    }

	public static void main(String[] args) {
		SpringApplication.run(ElasticApplication.class, args);
        // 獲取分詞器.
        AnalyzeRequest analyzeRequest = new AnalyzeRequest("test")
                .text("中華人民共和國港珠澳大橋建成通車")
                .analyzer("standard");
        List<AnalyzeResponse.AnalyzeToken> tokens = client.admin().indices()
                .analyze(analyzeRequest)
                .actionGet()
                .getTokens();
        for (AnalyzeResponse.AnalyzeToken token : tokens) {
            System.out.print(token.getTerm()+" ");
        }
	}
}

執行結果：

使用最大分詞器.

執行結果：

使用最小分詞器.

執行結果：

可以對比最小分詞效果沒有最大的分詞效果好一些.

ElasticSearch-6.4.1安裝中文分詞器Analysis-ik.

一：使用背景和安裝過程. 1. ElasticSearch-6.4.1.(Windows環境下) &nbs

Solr-6.5.1配置中文分詞器smartcn

solr的同步發行包smartcn可進行中文切詞，smartcn的分詞準確率不錯，但就是不能自己定義新的詞庫，不過smartcn是跟solr同步的，所以不需要額外的下載，只需在solr的例子中拷貝進去即可。第一步: 找到如下目錄，複製中文分詞器jar到so

（四）Solr6.4.1配置中文分詞器IK Analyzer詳解

Solr6.4.1配置中文分詞器IK Analyzer詳解 2.把IKAnalyzer.cfg.xml，mydict.dic，stopword.dic這三個檔案複製放入tomcat/solr專案web-info的classes下 3.把ik-analyz

ElasticSearch 6.5.4 安裝中文分詞器 IK和pinyiin

ES的常用的中文分詞有基於漢字的ik和基於拼音的pinyin https://github.com/medcl/elasticsearch-analysis-ik/releases https://github.com/medcl/elasticsearch-analysis-pinyi

Linux下ElasticSearch6.4.x、ElasticSearch-Head、Kibana以及中文分詞器IK的安裝配置

ElasticSearch 安裝配置下載 # 官網下載壓縮包 [[email protected] /home]# wget https://artifacts.elastic.co/downloads/elasticsearch/elasticsearch-6.

elasticsearch安裝中文分詞器

1. 分詞器的安裝 ./bin/elasticsearch-plugin install https://github.com/medcl/elasticsearch-analysis-ik/releases/download/v6.2.3/elasticsearch-analysis-ik-6.2.3.z

如何在Elasticsearch中安裝中文分詞器(IK+pinyin)

如果直接使用Elasticsearch的朋友在處理中文內容的搜尋時，肯定會遇到很尷尬的問題——中文詞語被分成了一個一個的漢字，當用Kibana作圖的時候，按照term來分組，結果一個漢字被分成了一組。這是因為使用了Elasticsearch中預設的標準分詞器，這個分詞器在處理中文的時候會把中文單詞切分成

安裝中文分詞器

1.將IKAnalyzer2012FF_u1.jar新增到tomcat->webapps->solr/WEB-INF/lib目錄下。 2.複製IKAnalyzer的配置檔案和自定義詞典和停用詞詞典到solr的classpath下。（也就是在solr的web-inf目錄下建立cl

Solr-4.10 配置中文分詞器(IKAnalyzer)

1、下載IKAnalyzer http://pan.baidu.com/s/1i3eXhAH 密碼：34w6 2、將ik的相關檔案拷貝到 webapps\solr\WEB-INF\lib 目錄下 3、引入相應詞典配置放到&

二、Elastic5.5.2安裝中文分詞器教程及簡單測試

一、下載分詞器安裝包首先進入各版本下載頁面，選擇相應的版本進行下載(和自己安裝的ElasticSearch版本保持一致)。我這裡安裝的是5.5.2的ElasticSearch,所以選擇對應的5.5.2軟體包。右鍵·複製下載連結·，在Linux系統中

Solr6.0.1配置中文分詞器mmseg4j

1、下載mmseg4j包和所需dic檔案 2、配置mmseg4j中文分詞器在solrhome中建立dic資料夾，並將dic欄位檔案複製進去將mmseg4j-core-1.10.0.jar和mmseg4j-solr-2.3.0.jar放到

理解ElasticSearch的中文分詞器【IK】

拷貝【target/releases/elasticsearch-analysis-ik-1.6.0.zip】中的檔案到【<ES_ROOT>/plugins/ik】目錄中。拷貝【elasticsearch-analysis-ik-1.6.0.zip】中的【config/ik】中的檔案到【<

Solr 7.2.1 配置中文分詞器 IK Analyzer

一、什麼是中文分詞器？為什麼不來個英文分詞器呢？ “嘿，小夥子，就是你，說的就是你，你那麼有才咋不上天呢！” 首先我們來拽一句英文：“He is my favorite NBA star”

基於高版本Lucene的中文分詞器（IK分詞器）的DEMO

注意為了大家方便，我沒有遮蔽資料庫，專案中用的資料來源請各位碼友不要亂搞~謝謝緣起日前專案中需要用到Lucene.且需要中文分詞，看了下IK分詞器，但是IK分詞器貌似只支援到lucene的3.X。後期的版本就不支援了，在網上找了一部分資料，自己寫了一個demo.因為中間

中文分詞器（IK）的配置檔案

中文（IK）分詞器是在IKAnalyzer分詞包中使用的，使用前請自行下載相應的jar包將這個檔案（IKAnalyzer.cfg.xml）放入到src的的目錄先， <?xml version="1.0" encoding="UTF-8"?> &

solr4.7中文分詞器（ik-analyzer）配置

solr本身對中文分詞的處理不是太好，所以中文應用很多時候都需要額外加一箇中文分詞器對中文進行分詞處理，ik-analyzer就是其中一個不錯的中文分詞器。一、版本資訊 solr版本：4.7.0 需要ik-analyzer版本：IK Analyzer 2012FF_h

Elasticsearch 2.4.1安裝IK分詞器

背景：公司老專案需要我去維護，該專案使用了老版本的elasticsearch,也就是2.4.1；於是準備在本地搭建一個測試環境玩一玩，結果風風火火的安裝了elasticsearch後準備安裝ik時，就啞火了。安裝流程：錯誤示範

SolrCloud-5.5.1配置中文分詞ansj-3.4.6

今天分享一下這兩天倒持的給solr5.5.1配置中文分詞的一些事項，本人剛剛開始研究SolrCloud，比照網上的教程與自己親身試驗的總結一下，通過這兩天的折騰覺得找對匹配的版本是頂頂重要的一件事。首先按照網上的教程來：第一步，下載ansj的

Elasticsearch安裝中文分詞外掛ik（ES 2.3.3 & IK 1.9.3）

最近用到elasticsearch做全文檢索知識庫系統，系統已經大致開發完成，需要中文分詞，故網上搜索了下配置方法，可嘗試幾個都不可用，然後就看IK的git原始碼中有介紹，試了下，相比其他方法簡單很

ElasticSearch搜索引擎安裝配置中文分詞器IK插件

art linux系統 nal smart 分享內容分詞 search dcl 一、IK簡介 ElasticSearch（以下簡稱ES）默認的分詞器是標準分詞器Standard，如果直接使用在處理中文內容的搜索時，中文詞語被分成了一個一個的漢字，因此引入中文分詞器IK就

ElasticSearch-6.4.1安裝中文分詞器Analysis-ik.

一：使用背景和安裝過程.

1. ElasticSearch-6.4.1.(Windows環境下)

2. 中文分詞器IKAnalyzer下載.

3. 來到ElasticSearch的安裝目錄.

4. 將剛才下載的IK解壓到ik目錄下.

5. 啟動ElasticSearch.(觀察一下啟動日誌).

6. 啟動head外掛.

7. 測試IK分詞器.(PostMan下測試)

7.1 一個刪除ES索引的測試.(自己測試的,與本文無關).

7.2 IK分詞效果有兩種,一種是ik_max_word（最大分詞）和ik_smart（最小分詞）

現在的分詞文字是：中華人名共和國港珠澳大橋建成通車.

8. REST API 使用AK分詞器.

8.1 測試最大分詞效果.

8.2 測試最小分詞效果.

二. JAVA API使用AK分詞器.

2.1 首先新建一個索引.

2.2 Java API使用分詞器.

首先是獲取TransportClient物件. 注入靜態方法中注意初始化的方式.

使用標準分詞器.

執行結果：

使用最大分詞器.

執行結果：

使用最小分詞器.

執行結果：

相關推薦