幾十行程式碼讓你知道朋友圈都是什麼樣的朋友
合幾大常用的Python資料分析包,結合itchat的能力實現朋友圈的分析。
從哪裡做起
微信現在越來越融入到了我們每個人的生活,從簡單的聊天工具到衣食住行的服務,再到傳播著豐富多彩資訊的自媒體和涵蓋萬物的小程式,微信儼然就是一個小的生態系統。而人,是整個微信生態的核心,每個人朋友圈就是自我小生態的核心。itchat為我們提供了獲取朋友資訊的介面:
friends=itchat.get_friends(update=True)[0:]
通過debug可以看到每個friend的資訊:

可以看到每個好友的資訊還是很豐富的,從暱稱、性別、到地域等,好友列表按照通訊錄排列,第一個是使用者自己,接著是星標置頂的好友,比如瑾瑾在我的列表裡排第一位。我們今天所有的工作都將從好友的資訊做起。
統計好友性別分佈
性別分佈是最容易統計的資料,通過檢視我自己和幾個好友的資料,得出sex和性別的對應關係為:
sex = 0: 未知sex = 1: 男生sex = 2: 女生 pyecharts 是一個用於生成 Echarts 圖表的類庫,而Echarts 是百度開源的一個數據視覺化 JS 庫。主要用於資料視覺化。利用pyecharts畫出好友性別分佈: from pyecharts import Pie boy=girl=nothing=0 for i in friends[1:]: sex =i[Sex] if sex==1: boy+=1 elif sex==2: girl+=1 else: nothing+=1 total=len(friends[1:]) attr=[迷妹,迷弟 , 低調的匿名粉絲] v1 = [boy,girl, nothing] pie = Pie(粉絲性別分佈, title_pos='center') pie.add(, attr, v1, radius=[40, 75], label_text_color=None,is_label_show=True,is_legend_show=False) pie.show_config()pie.render(./sex_data.html)
執行結果如下:

沒想到我的微信上的迷妹竟然比迷弟都多了這麼多,實在是吃鯨,還希望瑾瑾不要打我。
好友地域分佈
分析完好友的性別我們再來分析好友的地域分佈,看看自己的好友是不是遍佈天南地北:
from pyecharts import Map import pandas as pd def get_var(var): variable=[] for i in friends: value=i[var] variable.append(value) return variableNickName=get_var(NickName) Sex=get_var(Sex) Province=get_var('Province') Signature=get_var('Signature') city=get_var('City') data{'NickName':NickName,'Sex':Sex,'Province':Province,'Signature':Signature,'city':city} frame=pd.DataFrame(data) result1=frame.groupby(['Province'],as_index=False).size()a1=list(result1) a2=result1.indexmap=Map(我的好友佔了大半個中國啊!, 來自微信的朋友圈, title_pos=center,width=1200, height=600)map.add(, a2, a1, maptype='china', is_visualmap=True, visual_text_color='#000',visual_range=[1, 8], is_label_show=True, symbol=diamon, label_pos=inside ) map.show_config() map.render(./area_data.HTML)
最後的結果如下:

非常地準,作為一個飄過北、上、杭的“浪裡白條”,除了老家河南,我的好友基本集中在上海、北京和杭州,什麼時候也可以到廣深溜一波。
好友個性簽名詞雲分析
微信簽名是瞭解一個人性格和態度的重要參考,想看看我的朋友圈裡的大神們都是走的文藝風,還是小清新,還是大學霸… …話不多說,一試便知:jieba(結巴)是一個強大的分詞庫,完美支援中文分詞;wordcloud是一個基於Python的詞雲生成類庫,很好用;matplotlib.pyplot是一些命令列風格函式的集合,使matplotlib以類似於MATLAB的方式工作。每個pyplot函式對一幅圖片(figure)做一些改動:比如建立新圖片,在圖片建立一個新的作圖區域(plotting area),在一個作圖區域內畫直線,給圖新增標籤(label)等:
import reimport jieba import wordcloud as wc import numpy as np import PIL.Image as Imageimport matplotlib.pyplot as pltsig list=[] for i in friends: signature=i['Signature'].strip().replace(span,).replace(class,).replace(emoji,) rep=re.compile(1f\d+\w*|[/=]) signature=rep.sub(,signature) siglist.append(signature) text=.join(siglist) wordlist=jieba.cut(text,cut_all=True) word_space_split= .join(wordlist) coloring= np.array(Image.open(./1.jpg)) # 一張猴子圖片,試了很多照片,還是這個好
my_wordcloud= wc.WordCloud(background_color=white, # 背景顏色 mask=coloring, max_words=200, # 最大詞數max_font_size=60, # 字型最大值random_state=42, scale=4, # 按照比例進行放大畫布,如設定為1.5,則長和寬都是原來畫布的1.5倍。font_path=./HYQiHei-25J.ttf,# 字型,注意選擇合適的字型,否則可能會顯示亂碼。
width=400, height=200 # 畫素).generate(word_space_split) image_colors= wc.ImageColorGenerator(coloring)# plt.imshow(my_wordcloud.recolor(color_func=image_colors)) plt.imshow(my_wordcloud)plt.axis(off) # 不顯示座標軸plt.show()my_wordcloud.to_file('./test.jpg')
最後的結果如下:

對於詞雲的分佈也是有很多可以挖掘的資訊,看起來我的朋友們比較偏向於文藝風。愛自己、愛生活、有夢想、擁抱世界。我還在右下角的角落裡看到了低調的我交。
後記
微信是一個神奇的存在,它是一個國民級別的全民APP,所以,微信的產品設計一直都是一個有趣的現象,從最初底部Tab的數目、每個Tab的名稱、“發現頁面的定製、小程式入口、朋友圈入口到朋友圈評論等等一系列的設計細節,都是值得我們透過人性和心理去研究的。即使是被人們封神的張小龍”,在面對結構最為複雜的中國使用者群體的時候,他的瀟灑中依舊不免充滿無奈,從對朋友圈的置之不理就可以看出,這是一個怎麼做都不會讓人滿意的功能,任何一個生態在面對巨大的使用者群體的時候,功能的增減就會變成一個難題。