1. 程式人生 > >python爬蟲,Scrapy爬取豆瓣電影《芳華》電影短評,分詞生成詞雲圖。

python爬蟲,Scrapy爬取豆瓣電影《芳華》電影短評,分詞生成詞雲圖。

專案github地址:https://github.com/kocor01/scrapy_cloud

Python版本為3.6


自己寫的簡單架構python爬蟲,爬取豆瓣電影《芳華》電影短評,分詞生成詞雲圖。

這個是用Scrapy框架重新實現的


爬蟲爬取最近比較火的電影《芳華》分詞後生成詞雲圖

使用了 jieba分詞,雲圖用wordcloud生成

用了朋友的2B姿勢的自拍照片簡單的P了下(為了不暴露,P成全黑的),作為生成詞雲圖的底圖模板


在生成詞雲圖的過程中,發現一個問題,詞雲圖底圖模板有PNG格式的圖片生成出來的效果很差,例如用下圖PNG格式去生成,生成出來的詞語圖根本不成人形。本例是用JPG格式的圖片去生成,生成出來的效果還是相當不錯的。建議底圖用JPG去生成。其他格式的圖片沒試驗,不知生成的效果如何。



詞雲圖底圖模板:



生成詞雲圖效果: