1. 程式人生 > >四、solr自帶分詞器

四、solr自帶分詞器

從solr-6.5.0\contrib\analysis-extras\lucene-libs中將lucene-analyzers-smartcn-6.5.0.jar包複製到D:\360\tomcat8\apache-tomcat-8.0.36\webapps\solr\WEB-INF\lib


為例項新增對中文分詞的支援。編輯solr_home\solr_core\conf下的managed-schema檔案.

在</schema>前增加下面的內容

<fieldType name="text_smartcn" class="solr.TextField" positionIncrementGap="0">
    <analyzer type="index">
      <tokenizer class="org.apache.lucene.analysis.cn.smart.HMMChineseTokenizerFactory"/>
    </analyzer>
    <analyzer type="query">
       <tokenizer class="org.apache.lucene.analysis.cn.smart.HMMChineseTokenizerFactory"/>
    </analyzer>
</fieldType>

solr自帶的中文分詞器不能擴充套件使用者詞庫

使用分詞器的時候只要在<field>中修改type="text_smartcn"就好了