大家好,我是辰哥~~~
辰哥玩公眾號有一段時間了,這期文章分析一波讀者的留言情況,不僅可以對公眾號的各位鐵粉一目瞭然,還可以通過分析的結果對公眾號的經營進行更好的規劃。如讀者留言的內容通常是內容是什麼?關注的點是什麼等等這些。
分析目錄
累計使用者留言總數排名
每一篇文章留言總數排名
留言內容詞雲圖
回覆內容詞雲圖
分析每月留言總數排名
分析月份留言數top1 & 每天留言排名
分析辰哥每月發文情況
01、預覽資料
公眾號後臺提供資料匯出功能,辰哥通過該功能可以一鍵匯出成excel,資料內容如下:(涉及暱稱等隱私部分已打碼)
下面的資料主要需要用到的資料是紅框中的部分(留言者暱稱、留言內容、留言時間、回覆內容)
import pandas as pd
本文原始碼分析所用到的庫如上,pyecharts是視覺化庫(其中pyechart庫是1.9版本)、pandas用於讀取excel資料、collections用於累加統計、stylecloud和jieba用於詞雲圖。
讀入資料
df = pd.read_excel("留言匯出-Python研究者.xlsx")
02、資料分析 & 視覺化
分析1:累計使用者留言總數排名
name_counts = df.groupby('留言者暱稱')['留言內容'].count().sort_values(ascending=False).reset_index()
根據欄位留言者暱稱,統計每一位使用者的留言總數,並進行排序,取出top10。
圖中展示的是公眾號歷史以來使用者留言總數的top10。尤其是排名靠前的幾位,每次留言大多數都是前排,辰哥真心被感動到了(感動哭了)。
ps:圖中的暱稱是微信暱稱,由於林哥的微信暱稱是真名,所以就用林哥代替(平時我稱呼他為林哥,哈哈哈)
分析2:每一篇文章留言總數排名
article_counts = df.groupby('文章')['留言內容'].count().sort_values(ascending=False).reset_index()
對每一篇文章的評論數進行彙總,根據總數進行排名,取出評論數最多的前top10。
圖中右上角的順序是留言數從高到低,從整體上來看,這些文章要麼就是具備實用性,比如識別發票、禁止複製、人像卡通化等,要麼就是貼近大家的話題,比如全國大學資料、山河令、明星知識圖譜等。通過留言數前top10的文章,辰哥悟出了一個道理:要想留言多又好,實用與熱點少不了。
分析3:留言內容詞雲圖
contents = (df['留言內容']).tolist()
讀取excel中留言內容,因為含有float型別或者其他多種型別的文字,因此通過map(str,contents)轉為str型別。方便進行繪製詞雲圖。通過詞雲圖,看看讀者留言內容的關鍵詞有哪些?
圖上來看,【學習】和【辰哥】這兩個高頻我可以理解,【這個】和【可以】一般評論內容是什麼呢?ok,咱們先看來看一下含有【這個】和【可以】的評論是通常是哪些!
關鍵詞:可以
contents = (df['留言內容']).tolist()key_list = [str(i) for i in contents if "可以" in str(i)]
關鍵詞:這個
contents = (df['留言內容']).tolist()key_list = [str(i) for i in contents if "這個" in str(i)]
分析4:回覆內容詞雲圖
分析3看到的是讀者的評論關鍵詞詞雲圖,上圖是辰哥回覆評論的詞雲圖,可以看到辰哥回覆的最多的是表情包(離不開表情包),比如、
、
、
。此外還有就是【謝謝】、【學習】、【加油】,看來辰哥也是一個有禮貌、勵志的,哈哈哈哈(自誇一下)
分析5:分析每月留言總數排名
data = (df['留言時間']).tolist()
分析每一個月的留言總數,統計結果如下:
2021-06 144
2021-05 99
2021-04 96
2021-03 86
2021-07 44
2021-02 26
2020-11 24
2020-12 16
2021-01 14
2020-10 13
2020-09 2
2018-05 1
2020-08 1
從圖中資料上來看,從今年2月開始,每月的評論總數逐漸遞增(7月還沒結束,所以未排第一),這個好像也可以說得通,因為越往後,讀者也多,評論數也隨之增加。目前一個月評論總數最多是上個月(6月),達到了144條。7月爭取原超6月的資料~~~
分析6:分析月份留言數top1 & 每天留言排名
data = (df['留言時間']).tolist()
在分析5中,得知2021年6月的評論總數是最多的(144),接著分析該月裡,每天的評論資料具體是多少?
可以看到在6月30號的時候評論數最多(剛好萬粉的時候,所以評論較多),從整體上來看,一天的評論數均值是6或者7。
分析7:分析辰哥每月發文情況
data = (df['發文時間']).tolist()
通過excel中的發文時間,可以統計到辰哥每一個月的發文數量。
圖中可以看到辰哥在近幾個月(今年3月至今),更新頻率保持穩定,大約是每一個月發15篇原創(評論裡面僅統計原創文章),相當於是隔天更新一次。
03、小結
辰哥對公眾號一直以來的評論進行了一次分析,主要是從7個方面去對評論資料進行了分析 & 視覺化~~~
分析目錄
累計使用者留言總數排名
每一篇文章留言總數排名
留言內容詞雲圖
回覆內容詞雲圖
分析每月留言總數排名
分析月份留言數top1 & 每天留言排名
分析辰哥每月發文情況
最後辰哥悟出了一個道理:要想留言多又好,實用與熱點少不了。