Python | 資料探勘,WordCloud詞雲配置過程及詞頻分析
一. 安裝WordCloud
在使用WordCloud詞雲之前,需要使用pip安裝相應的包。
pip install WordCloud pip install jieba
其中WordCloud是詞雲,jieba是結巴分詞工具。
問題:在安裝WordCloud過程中,你可能遇到的第一個錯誤如下。
error: Microsoft Visual C++ 9.0 is required. Get it from http://asa.ms/vcpython27

解決方法也很簡單,下載VCForPython27安裝(Microsoft Visual C++ Compiler for Python 2.7)。但是在微軟下載總是沒響應。
這是最大的問題,下面我自己提供一個CSDN的地址供大家下載。下載完成,可以進行安裝響應的庫函式。
資源地址:
http://download.csdn.net/detail/eastmount/9788218
安裝完成之後,可以正常執行程式碼啦。
二. 簡單詞雲程式碼
下面這部分程式碼參考老曹的,希望對你有所幫助。
老曹說:什麼是詞雲呢?詞雲又叫文字雲,是對文字資料中出現頻率較高的“關鍵詞”在視覺上的突出呈現,形成關鍵詞的渲染形成類似雲一樣的彩色圖片,從而一眼就可以領略文字資料的主要表達意思。
程式碼如下:
這是中文編碼問題,下面講解解決方法。
三. 中文編碼錯誤及解決
在WordCloud安裝的目錄下找到WordCloud.py檔案,對原始碼進行修改。
注意,此時執行程式碼還是報錯,因為需要在同一個目錄下放置msyh.ttf字型檔案供程式呼叫,如下圖所示,這是原來的字型DroidSansMono.ttf。
也可以採用下面的程式碼:
wordcloud = WordCloud(font_path = 'MSYH.TTF').fit_words(word)
四. 照片背景的詞雲程式碼
下面進一步深入,假設存在一個圖 "sss3.png",核心程式碼如下:
原文釋出時間為:2018-09-18
本文作者: 上海小胖