10分鐘教你用Python玩轉微信之抓取好友個性簽名製作詞雲
阿新 • • 發佈:2018-11-27
01 前言+展示
各位小夥伴我又來啦。今天帶大家玩點好玩的東西,用Python抓取我們的微信好友個性簽名,然後製作詞雲。怎樣,有趣吧~好了,下面開始幹活。我知道你們還是想先看看效果的。
後臺登入:
詞雲:
02 環境準備
Python版本:3.6.0
系統平臺:Windows 10 X64
IDE:pycharm
相關模組:
re模組;
itchat模組;
jieba模組;
import matplotlib.pyplot模組;
wordcloud模組;
以及一些Python自帶的模組。
03 獲取個性簽名
首先要做的,當然還是登入微信,獲取好友的個性簽名啦:
1 import itchat
2# 先登入
3itchat.login()
4
5# 獲取好友列表
6 friends = itchat.get_friends(update=True)[0:]
7 for i in friends:
8 # 獲取個性簽名
9 signature = i["Signature"]
10print(signature)
但是獲取下來之後我們會發現,有大量的span,class,emoji,emoji1f3c3等的欄位:
這是因為個性簽名中使用了表情符號,這些欄位我們都是要過濾掉的,所以寫個正則和然後用replace方法去掉吧。
04 過濾掉emoji表情
這次把相關欄位給replace成空格先:
1# 獲取好友列表
2friends = itchat.get_friends(update=True)[0:]
3for i in friends:
4 signature = i["Signature"].strip().replace("span", "").replace("class" , "").replace("emoji", "")# 獲取個性簽名
5 print(signature)
然後發現,還是不太妥當:
這裡要藉助一下re了,寫個正則把這些統統幹掉:
1# 獲取好友列表
2friends = itchat.get_friends(update=True)[0:]
3for i in friends:
4 signature = i["Signature"].strip().replace("span", "").replace("class", "").replace("emoji", "")# 獲取個性簽名
5 rep = re.compile("< =.+/>")# 正則匹配過濾掉emoji表情,例如emoji1f3c3等
6 signature = rep.sub("", signature)
7 print(signature)
為了照顧新手朋友,這裡直接用了最簡單的正則形式,把尖括號兩端的直接匹配然後幹掉,不過一般不推薦這樣幹。推薦用這樣的表示式rep = re.compile("[^\u4e00-\u9fa5^]")。關於正則和re大家還是自己去找資料學習吧。然後perfect了:
05 製作詞雲
接來下用jieba分詞,然後製作成詞雲,在此之前記得安裝jieba和wordcloud庫。
1 # jieba分詞
2 wordlist_jieba = jieba.cut(text, cut_all=True)
3 wl_space_split = " ".join(wordlist_jieba)
4
5 # 這裡要選擇字型存放路徑,win的字型在windows/Fonts中
6 # #如果是中文必須要新增字型路徑,否則會顯示成框框
7 my_wordcloud = WordCloud(background_color="white", width=1600, height=1200,
8 font_path='C:\Windows\Fonts\蘋方\PingFang Bold_0.ttf').generate(wl_space_split)
9
10plt.imshow(my_wordcloud)
11plt.axis("off")
12plt.show()
記得要設定好中文路徑哦。
效果圖:
06 完整程式碼
欲獲取程式碼,請關注我們的微信公眾號【程式猿聲】,在後臺回覆:pycode02。即可獲取。
微信公眾號推薦文章:10分鐘教你用Python做個打飛機小遊戲超詳細教程
推薦文章:10分鐘教你用python下載和拼接微信好友頭像圖片