1. 程式人生 > >Py之jieba:Python包之jieba包——中文分詞最好的元件

Py之jieba:Python包之jieba包——中文分詞最好的元件

jieba簡介


應該算得上是分詞領域的佼佼者,想要使用python做文字分析,分詞是必不可少的一個環節。
(1)支援三種分詞模式:
  (1)精確模式:試圖將句子最精確的切開,適合文字分析。
  (2)全模式:把句子中所有可以成詞的詞語都掃描出來,速度非常快,但是不能解決歧義。
  (3)搜尋引擎模式:在精確模式的基礎上,對長詞再次切分,提高召回率,適合用於搜尋引擎分詞。
(2)支援繁體分詞
(3)支援自定義詞典
 

jieba安裝


pip install jieba

好啦,大功告成,開始使用吧!

jieba使用方法