1. 程式人生 > >python資料探勘實戰筆記——文字挖掘(4):詞雲繪製

python資料探勘實戰筆記——文字挖掘(4):詞雲繪製

概念: 詞雲:詞雲是指對文字中詞頻較高的分詞,給予視覺上的突出,形成“關鍵詞渲染”,從而過濾掉大量的文字資訊,使瀏覽者一眼掃過就可以領略文字的主旨。 在這裡插入圖片描述 需要用到的包:wordcloud、matplotlib wordcloud包下載地址:http://www.lfd.uci.edu/~gohlke/pythonlibs/

#繪製詞雲
from wordcloud import WordCloud
import matplotlib.pyplot as plt

wordcloud = WordCloud(
    font_path='D:\\PDM\\2.4\\simhei.ttf', 
    background_color="black"
)
#將資料框格式的資料轉換為字典格式
words = fSegStat.set_index('segment').to_dict()
#根據詞頻生成詞雲
wordcloud.fit_words(words['計數'])
#wordcloud.fit_words()接收一個字典,包括詞及對應的詞頻,識別然後繪製成詞雲
plt.imshow(wordcloud)

plt.close()

詞雲繪製完成: 在這裡插入圖片描述 關於wordcloud函式的基本用法及引數詳解,另附一篇部落格供參考:

wordcloud.WordCloud(font_path=None, width=400, height=200, margin=2, ranks_only=None, prefer_horizontal=0.9,mask=None, scale=1, color_func=None, max_words=200, min_font_size=4, stopwords=None, random_state=None,background_color='black', max_font_size=None, font_step=1, mode='RGB', relative_scaling=0.5, regexp=None, collocations=True,colormap=None, normalize_plurals=True)

---------------------