1. 程式人生 > >我用 Python 爬取微信好友,最後發現一個大祕密

我用 Python 爬取微信好友,最後發現一個大祕密

前言

你身處的環境是什麼樣,你就會成為什麼樣的人。現在人們日常生活基本上離不開微信,但微信不單單是一個即時通訊軟體,微信更像是虛擬的現實世界。你所處的朋友圈是怎麼樣,慢慢你的思想也會變的怎麼樣。最近在學習 itchat,然後就寫了一個爬蟲,爬取了我所有的微信好友的資料。並對其中的一些資料進行分析,發現了一些很有趣的事。

微信好友爬蟲

講之前先給大家推薦一個學習交流的地方719-139-688喜歡python的朋友可以一起來,此次的爬蟲程式用到的庫有很多,其中爬取微信資料用到的事 itchat。需要你先去下安裝。安裝完成以後,你就可以通過 itchat.login() 這個函式登陸你自己的微信。它回彈出一個網頁登陸的二維碼,你用手機掃描登陸即可。

然後通過 itchat.get_friends() 這個函式就可以獲取到自己好友的相關資訊,這些資訊是一個 json 資料返回。然後我們就可以根據這些返回的資訊,進行正則匹配抓取我們想要的資訊,在進行分析。

import itchatitchat.login()#爬取自己好友相關資訊, 返回一個json檔案friends = itchat.get_friends(update=True)[0:]

我的微信好友的男女比例

觀察返回的資料,很容易就可以根據關鍵字發現性別是存放在一個字典裡面,它的 key 是「Sex」,男性值為 1,女性為 2,其他是不明性別的(就是沒有填的)。

在程式碼裡我定義了一個函式 parse_friends() 通過一個 for 迴圈,把獲取到的資料通過 for 迴圈儲存到 text 字典裡。然後再通過 draw() 函式畫出柱狀圖。柱狀圖使用的是 plt 庫,之前也寫過一篇文章,感興趣的同學可以去檢視。

最後列印的結果:

不得不多說我微信的 1K 多的好友男女比列非常的不協調,男多女少啊。這讓我回想起以前高中一個班 50 個人,女生就 7 個,然後我們班的女生從此就有一個女團稱呼「七仙女」。

我的微信好友個性簽名的自定義詞雲圖

為了進一步分析我的好友大致都有什麼特徵,我把好友的個性簽名一起抓取,分析製作成詞雲。

個性簽名是儲存在 Signature 這個 key 中,由於有些簽名包含些表情,最初抓取會變成 emoji、span、class 等等這些無關的詞。所有需要先替換掉,另外,還有類似 <>/= 之類的符號,也需要寫個簡單的正則替換掉,再把所有拼起來,得到 text 字串。

得到的資料最後儲存到當前目錄名為「text.txt」文字中。

分析好友簽名的函式我定義成:parse_signature(),完整程式碼如下:

抓取整理了簽名的資料,接下來就是製作出詞雲。這裡使用的是 wordCloud 來進行詞雲的製作。之前的文章也有介紹過詞雲的製作,感興趣的同學可以檢視這篇文章。

詞雲的製作我定義了一個:draw_signature() 函式,完整程式碼如下

執行上面的程式碼後得到了如下的圖,由於好友數量比較多,我分別找了兩張圖製作出圖雲。

努力,奮鬥,世界,生活,自己。這些詞在我們 1K 多人的好友中出現的最多。大家都非常的優秀,都非常的上進

相關推薦

Python 好友最後發現一個祕密

前言你身處的環境是什麼樣,你就會成為什麼樣的人。現在人們日常生活基本上離不開微信,但微信不單單是一個即時通訊軟體,微信更像是虛擬的現實世界。你所處的朋友圈是怎麼樣,慢慢你的思想也會變的怎麼樣。最近在學習 itchat,然後就寫了一個爬蟲,爬取了我所有的微信好友的資料。並對其中的一些資料進行分析,發現了一些很有

Python 好友最後發現一個秘密

代碼 我們 同學 strong 分享 簽名 ast ron tps 前言 你身處的環境是什麽樣,你就會成為什麽樣的人。現在人們日常生活基本上離不開微信,但微信不單單是一個即時通訊軟件,微信更像是虛擬的現實世界。你所處的朋友圈是怎麽樣,慢慢你的思想也會變的怎麽樣。最近在學習

PK10平臺開發與python公眾號文章

網址 谷歌瀏覽器 pytho google http 開發 微信 安裝python rom 本文通過微信提供微信PK10平臺開發[q-21528-76294] 網址diguaym.com 的公眾號文章調用接口,實現爬取公眾號文章的功能。註意事項 1.需要安裝python s

python爬蟲:利用python好友,獲得男女比例。

(需要先下個itchat庫,  pip install itchat)  import itchat # 先登入 itchat.login() # 獲取好友列表 friends = itchat.

python公眾號文章

本文通過微信提供的公眾號文章呼叫介面,實現爬取公眾號文章的功能。 # -*- coding: utf-8 -*- from selenium import webdriver import time import json import reques

1] python 好友個性簽名生成詞雲

在Anaconda下完成,參考https://blog.csdn.net/zhonglixianyun/article/details/78229782結果圖:1. 需要的庫  numpy, os,  itchat, wordcloud, jieba, 1) 安裝itchat

項目實戰!Python了14年所有的福彩3D

下載器 rap 寫入excel url req 理論 ola text port 前兩天,在網上看到一個有意思的問題:×××靠譜麽?為什麽還有那麽多的人相信×××? 暫且不說,×××是否靠譜?×××也分人而異,江湖上騙術很多,有些甚至會誤以為×××的準確度可以很高,這些操盤

python+itchat 好友資訊

專案環境 語言:Python3 編輯器:Pycharm 導包:matplotlib、numpy、wordCloud、PIL、jieba、itchat 前言 近朱者赤,近墨者黑。微信已成為我們生活中必不可少的通訊社交工具,朋友圈一個分享我們生活的平臺,接下來先拿我的微信好友開刀,一

Python還能幹嘛】好友頭像完成馬賽克拼圖(千圖成像)~

馬賽克拼圖 何謂馬賽克拼圖(千圖成像),簡單來說就是將若干小圖片平湊成為一張大圖,如下圖路飛一樣,如果放大看你會發現裡面都是一些海賊王裡面的圖片。 Our Tragets 爬取所有微信好友的頭像

Python網易雲音樂上的Hip-hop歌單分析rapper如何押韻

line gone 謠言 大致 -i 態度 大眾 其中 當前 緣起 《中國有嘻哈》這個節目在這個夏天吸引了無數的目光,也讓嘻哈走進了大眾的視野。作為我今年看的唯一一個綜藝節目,它對我的影響也蠻大。這個夏天,我基本都在杭州度過,在上下班的taxi上,我幾乎都在刷這個節目,最後

python博數據並生成詞雲

font 意思 extra 很多 返回 json 自己 技術分享 pre 很早之前寫過一篇怎麽利用微博數據制作詞雲圖片出來,之前的寫得不完整,而且只能使用自己的數據,現在重新整理了一下,任何的微博數據都可以制作出來,放在今天應該比較應景。 一年一度的虐汪節,是繼續蹲在角落默

誰當年還沒看過幾本小說!Python全站的的小說!

nec 打印 b數 技術分享 mon 結果 鏈接 ons ide 然後再將請求發送出去,定義變量response,用read()方法觀察,註意將符號解碼成utf-8的形式,省的亂碼: 打印一下看結果: 看到這麽

Python公眾號歷史文章進行資料分析

思路: 1. 安裝代理AnProxy,在手機端安裝CA證書,啟動代理,設定手機代理; 2. 獲取目標微信公眾號的__biz; 3. 進入微信公眾號的歷史頁面; 4. 使用Monkeyrunner控制滑屏;獲取更多的歷史訊息; 5. 記錄文章標題,摘要,建立時間,創作型別,地

Python博資料生成詞雲圖片

很早之前寫過一篇怎麼利用微博資料製作詞雲圖片出來,之前的寫得不完整,而且只能使用自己的資料,現在重新整理了一下,任何的微博資料都可以製作出來,放在今天應該比較應景。 一年一度的虐汪節,是繼續蹲在角落默默吃狗糧還是主動出擊告別單身汪加入散狗糧的行列就看你啦,七夕送什麼才有心意,程式猿可以試試用

好友資訊進行視覺化分析(頭像人臉識別部分已更新!)(程式碼已上傳)

【Code】下載 1、專案說明 本次專案主要實現了以下功能: 2、微信好友資訊的獲取與檔案儲存 3、微信好友性別分析 4、微信好友地區分佈視覺化 5、微信好友個性簽名詞雲圖及好友備註詞雲圖 6、微信好

好友的部分資料並將所有人的個性簽名製成詞雲圖哈哈~~~~

import itchat itchat.login() friends = itchat.get_friends(update=True)[0:] male = female = other = 0 for i in friends[1:]: sex = i[

分手後小夥怒Python上萬空姐照片校花選舉大賽!

代碼 美女圖片 pst caption alt .... 不出 ima bee 首先展示下Python爬取到的成果: 我做什麽都要爭第一,這次的校花投票選舉大賽也不例外,雖然我是個男的......但是我看到了前女友竟然已經有三百多票排到第三名了,我怎麽能眼睜

教你python喜馬拉雅FM音訊乾貨分享~

前前言 喜馬拉雅已經更換標籤,我重新更新了下程式碼,文章暫時未改,因為思路還是如此,需要的可以掃一下文末公眾號二維碼(本人會在上面發表爬蟲以及java的文章還有送書等資源福利哦),也可以直接搜尋公眾號“ 猿獅的單身日常”,好了廣告結束... 前言 之前寫過爬取圖片的一篇文章,這回來看看如

10分鐘教你Python玩轉之抓好友個性簽名製作詞雲

01 前言+展示 各位小夥伴我又來啦。今天帶大家玩點好玩的東西,用Python抓取我們的微信好友個性簽名,然後製作詞雲。怎樣,有趣吧~好了,下面開始幹活。我知道你們還是想先看看效果的。 後臺登入: 詞雲: 02 環境準備 Python版本:3.6.0系統平臺:W

Python了自己的好友原來他們是這樣的人……

導讀: 用了微信幾年了,微訊號有也不少了,但是真正瞭解自己的好友嗎?好友最多的城市