1. 程式人生 > >10分鐘教你用Python玩轉微信之抓取好友個性簽名製作詞雲

10分鐘教你用Python玩轉微信之抓取好友個性簽名製作詞雲

01 前言+展示

各位小夥伴我又來啦。今天帶大家玩點好玩的東西,用Python抓取我們的微信好友個性簽名,然後製作詞雲。怎樣,有趣吧~好了,下面開始幹活。我知道你們還是想先看看效果的。

後臺登入:


詞雲:

02 環境準備

Python版本:3.6.0
系統平臺:Windows 10 X64
IDE:pycharm

相關模組:
re模組;
itchat模組;
jieba模組;
import matplotlib.pyplot模組;
wordcloud模組;
以及一些Python自帶的模組。

03 獲取個性簽名

首先要做的,當然還是登入微信,獲取好友的個性簽名啦:

 1
import itchat
2# 先登入
3itchat.login()
4
5# 獲取好友列表
6 friends = itchat.get_friends(update=True)[0:]
7 for i in friends:
8    # 獲取個性簽名
9    signature = i["Signature"]
10print(signature)

但是獲取下來之後我們會發現,有大量的span,class,emoji,emoji1f3c3等的欄位:

這是因為個性簽名中使用了表情符號,這些欄位我們都是要過濾掉的,所以寫個正則和然後用replace方法去掉吧。

04 過濾掉emoji表情

這次把相關欄位給replace成空格先:

1# 獲取好友列表
2friends = itchat.get_friends(update=True)[0:]
3for i in friends:
4  signature = i["Signature"].strip().replace("span""").replace("class"
"").replace("emoji""")# 獲取個性簽名
5  print(signature)

然後發現,還是不太妥當:

這裡要藉助一下re了,寫個正則把這些統統幹掉:

1# 獲取好友列表
2friends = itchat.get_friends(update=True)[0:]
3for i in friends:
4  signature = i["Signature"].strip().replace("span""").replace("class""").replace("emoji""")# 獲取個性簽名
5  rep = re.compile("< =.+/>")# 正則匹配過濾掉emoji表情,例如emoji1f3c3等
6  signature = rep.sub("", signature)
7  print(signature)

為了照顧新手朋友,這裡直接用了最簡單的正則形式,把尖括號兩端的直接匹配然後幹掉,不過一般不推薦這樣幹。推薦用這樣的表示式rep = re.compile("[^\u4e00-\u9fa5^]")。關於正則和re大家還是自己去找資料學習吧。然後perfect了:

05 製作詞雲

接來下用jieba分詞,然後製作成詞雲,在此之前記得安裝jieba和wordcloud庫。

 1 # jieba分詞
2 wordlist_jieba = jieba.cut(text, cut_all=True)
3 wl_space_split = " ".join(wordlist_jieba)
4
5 # 這裡要選擇字型存放路徑,win的字型在windows/Fonts中
6 # #如果是中文必須要新增字型路徑,否則會顯示成框框
7 my_wordcloud = WordCloud(background_color="white", width=1600, height=1200,
8                         font_path='C:\Windows\Fonts\蘋方\PingFang Bold_0.ttf').generate(wl_space_split)
9
10plt.imshow(my_wordcloud)
11plt.axis("off")
12plt.show()

記得要設定好中文路徑哦。

效果圖:

06 完整程式碼

欲獲取程式碼,請關注我們的微信公眾號【程式猿聲】,在後臺回覆:pycode02。即可獲取。

微信公眾號微信公眾號

推薦文章:10分鐘教你用Python做個打飛機小遊戲超詳細教程
推薦文章:10分鐘教你用python下載和拼接微信好友頭像圖片