大家好,我是辰哥~~~

辰哥玩公眾號有一段時間了,這期文章分析一波讀者的留言情況,不僅可以對公眾號的各位鐵粉一目瞭然,還可以通過分析的結果對公眾號的經營進行更好的規劃。如讀者留言的內容通常是內容是什麼?關注的點是什麼等等這些。

分析目錄

  1. 累計使用者留言總數排名

  2. 每一篇文章留言總數排名

  3. 留言內容詞雲圖

  4. 回覆內容詞雲圖

  5. 分析每月留言總數排名

  6. 分析月份留言數top1 & 每天留言排名

  7. 分析辰哥每月發文情況

01、預覽資料

公眾號後臺提供資料匯出功能,辰哥通過該功能可以一鍵匯出成excel,資料內容如下:(涉及暱稱等隱私部分已打碼)

下面的資料主要需要用到的資料是紅框中的部分(留言者暱稱、留言內容、留言時間、回覆內容)

import pandas as pd

本文原始碼分析所用到的庫如上,pyecharts是視覺化庫(其中pyechart庫是1.9版本)、pandas用於讀取excel資料、collections用於累加統計、stylecloud和jieba用於詞雲圖。

讀入資料

df = pd.read_excel("留言匯出-Python研究者.xlsx")

02、資料分析 & 視覺化

分析1:累計使用者留言總數排名

name_counts = df.groupby('留言者暱稱')['留言內容'].count().sort_values(ascending=False).reset_index()

根據欄位留言者暱稱,統計每一位使用者的留言總數,並進行排序,取出top10。

圖中展示的是公眾號歷史以來使用者留言總數的top10。尤其是排名靠前的幾位,每次留言大多數都是前排,辰哥真心被感動到了(感動哭了)。

ps:圖中的暱稱是微信暱稱,由於林哥的微信暱稱是真名,所以就用林哥代替(平時我稱呼他為林哥,哈哈哈)

分析2:每一篇文章留言總數排名

article_counts = df.groupby('文章')['留言內容'].count().sort_values(ascending=False).reset_index()

對每一篇文章的評論數進行彙總,根據總數進行排名,取出評論數最多的前top10。

圖中右上角的順序是留言數從高到低,從整體上來看,這些文章要麼就是具備實用性,比如識別發票、禁止複製、人像卡通化等,要麼就是貼近大家的話題,比如全國大學資料、山河令、明星知識圖譜等。通過留言數前top10的文章,辰哥悟出了一個道理:要想留言多又好,實用與熱點少不了

分析3:留言內容詞雲圖

contents = (df['留言內容']).tolist()

讀取excel中留言內容,因為含有float型別或者其他多種型別的文字,因此通過map(str,contents)轉為str型別。方便進行繪製詞雲圖。通過詞雲圖,看看讀者留言內容的關鍵詞有哪些?

圖上來看,【學習】和【辰哥】這兩個高頻我可以理解,【這個】和【可以】一般評論內容是什麼呢?ok,咱們先看來看一下含有【這個】和【可以】的評論是通常是哪些!

關鍵詞:可以

contents = (df['留言內容']).tolist()key_list = [str(i) for i in contents if "可以" in str(i)]

關鍵詞:這個

contents = (df['留言內容']).tolist()key_list = [str(i) for i in contents if "這個" in str(i)]

分析4:回覆內容詞雲圖

分析3看到的是讀者的評論關鍵詞詞雲圖,上圖是辰哥回覆評論的詞雲圖,可以看到辰哥回覆的最多的是表情包(離不開表情包),比如。此外還有就是【謝謝】、【學習】、【加油】,看來辰哥也是一個有禮貌、勵志的,哈哈哈哈(自誇一下)

分析5:分析每月留言總數排名

data = (df['留言時間']).tolist()

分析每一個月的留言總數,統計結果如下:

2021-06 144

2021-05 99

2021-04 96

2021-03 86

2021-07 44

2021-02 26

2020-11 24

2020-12 16

2021-01 14

2020-10 13

2020-09 2

2018-05 1

2020-08 1

從圖中資料上來看,從今年2月開始,每月的評論總數逐漸遞增(7月還沒結束,所以未排第一),這個好像也可以說得通,因為越往後,讀者也多,評論數也隨之增加。目前一個月評論總數最多是上個月(6月),達到了144條。7月爭取原超6月的資料~~~

分析6:分析月份留言數top1 & 每天留言排名

data = (df['留言時間']).tolist()

在分析5中,得知2021年6月的評論總數是最多的(144),接著分析該月裡,每天的評論資料具體是多少?

可以看到在6月30號的時候評論數最多(剛好萬粉的時候,所以評論較多),從整體上來看,一天的評論數均值是6或者7。

分析7:分析辰哥每月發文情況

data = (df['發文時間']).tolist()

通過excel中的發文時間,可以統計到辰哥每一個月的發文數量。

圖中可以看到辰哥在近幾個月(今年3月至今),更新頻率保持穩定,大約是每一個月發15篇原創(評論裡面僅統計原創文章),相當於是隔天更新一次。

03、小結

辰哥對公眾號一直以來的評論進行了一次分析,主要是從7個方面去對評論資料進行了分析 & 視覺化~~~

分析目錄

  1. 累計使用者留言總數排名

  2. 每一篇文章留言總數排名

  3. 留言內容詞雲圖

  4. 回覆內容詞雲圖

  5. 分析每月留言總數排名

  6. 分析月份留言數top1 & 每天留言排名

  7. 分析辰哥每月發文情況

最後辰哥悟出了一個道理:要想留言多又好,實用與熱點少不了