solrcloud配置中文分詞器ik
阿新 • • 發佈:2017-10-26
lte config server field per str load fonts textfield
無論是solr還是luncene,都對中文分詞不太好,所以我們一般索引中文的話需要使用ik中文分詞器。
三臺機器(192.168.1.236,192.168.1.237,192.168.1.238)已經安裝好了solrcloud
我安裝的是solr5.5使用的是ik是IKAnalyzer2012FF_u2.rar
下載IKAnalyzer2012FF_u2.rar下載地址:http://download.csdn.net/detail/sunqingzhong44/9835849
一下步驟三臺機器都要操作
下載後進行進行解壓
復制IKAnalyzer2012FF_u2.jar到tomcat/weapps/solr/WEB-INF/lib/下
復制ext.dic,IKAnalyzer.cfg.xml到tomcat/weapps/solr/WEB-INF/classes下
一下操作只在一臺機器上操作即可
下載collection在zookeeper上所對應的schema.xml配置文件
[plain] view plain copy
- /usr/local/solr/server/scripts/cloud-scripts/zkcli.sh -zkhost 192.168.1.236:2181 -cmd getfile /configs/mycollection3
- /schema.xml schema.xml
/configs/mycollection3/schema.xml #這是zookeeper上的配置文件
schema.xml #這是下載後的文件
修改下載的schema.xml文件
在最後增加:
[html] view plain copy
- <fieldType name="text_ik" class="solr.TextField">
- <analyzer type="index" useSmart="false" isMaxWordLength="false" class="org.wltea.analyzer.lucene.IKAnalyzer"></analyzer>
- <analyzer type="query" useSmart="true" isMaxWordLength="true" class="org.wltea.analyzer.lucene.IKAnalyzer"></analyzer>
- </fieldType>
可以在定義域的時候使用ik分詞器:
[html] view plain copy
- <field name="name" type="text_ik" indexed="true" stored="true"/>
- <field name="text" type="text_ik" indexed="true" stored="true"/>
上傳修改好的配置文件schema.xml到zookeeper上
[html] view plain copy
- /usr/local/solr/server/scripts/cloud-scripts/zkcli.sh -zkhost 192.168.1.236:2181 -cmd putfile /configs/mycollection2
- /schema.xml schema.xml
/configs/mycollection3/schema.xml #這是zookeeper上的配置文件
schema.xml #這是修改後的文件
重新啟動tomcat後測試:
solrcloud配置中文分詞器ik