1. 程式人生 > >python學習筆記(一)jieba模組初探

python學習筆記(一)jieba模組初探

環境說明:windows 7,python27,jieba VERSION 0.38,pycharm2016.1

1.簡介:

 支援中文分詞,關鍵字提取,詞性標註,自己管理詞庫等

2.安裝:

方法一:開始->搜尋cmd->cd到pip.exe目錄->輸入命令pip install jieba

3.程式碼片段:

import jieba
seg = jieba.cut('有關青春萌動',True
/False)#分詞,True/False  全模式/精確模式

seg = jieba.cut_for_search('有關青春萌動',True)#分詞,搜尋引擎模式

#seg 是迭代器,可通過list(seg)將其轉換為列表

#關鍵詞提取(import jieba.analyse)(sentence,關鍵詞數目)
import jieba.analyse
seg  = jieba.analyse.extract_tags('有關青春萌動',12)
print ' '.join(seg)

#詞性標註

# import jieba.posseg as pseg
words = pseg.cut("我愛北京天安門")
for w in words:

  print w.word,w.flag