職場社交軟體脈脈職言區最近一個星期在聊什麼？

阿新 • • 發佈：2018-12-12

工作之餘在學習python,筆者主流語言是php,初學抓取了近來一個星期的脈脈職言區的帖子，現將過程記錄如下。

脈脈是一款職場社交軟體，大家會在職言區，也就是之前的匿名區去吐槽，但是帖子是登入之後才能看，所以第一步需要python模擬登入

模擬登入

首先在網頁上登入，開啟開發者工具，會看到一個gossip_list連線，這個就是列表的介面了，引數需要如下

是的，右邊的引數就是我們獲取資料的時候需要的引數了，cookie資訊放在header頭裡模擬瀏覽器登入資訊，把引數拼接好，去訪問，能正常返回資料，如下圖：

這樣就拿到了資料結構了，然後寫獲取URL的方法，拼接URL，程式碼如下

def geturl(page):
        url = 'https://maimai.cn/sdk/web/gossip_list?'
        params = {
                'u':'****',
                'channel':'www',
                'version':'4.0.0',
                '_csrf':'*****',
                'access_token':'*****',
                'uid':'*****',
                 
'token':'*****',
                'page':page,
                'jsononly':'1'
        }
        for item in params:
                url = url + item + '='+ params[item] + "&"
        url = url[:-1]
        return url;

獲取了URL之後，根據已經拿到的cookie去拿取資料，程式碼如下：

def getGossipList():
        headers 
={
               'Accept':'text/html,application/shtml+xml,application/xml',
                'Accept-Encoding':'gzip, deflate, br',
                'Accept-language':'zh-CN,zh;q=0.9',
                'Connection':"keep-alive",
                'Host':'maimai.cn',
                'User-Agent':'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_13_6) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.102 Safari/537.36',
                'cookie':'******，
                'referer':'https://maimai.cn/gossip_list'
        }
        i = 0
        while (i<200):
                url = geturl(str(i));
                r = requests.get(url,timeout=10,headers=headers)
                if r=='': return
                data=r.json()['data']
                for item in data:
                        saveData(item)
                i = i+1

存取資料

把拿到的資料存入sqlite,一般Mac或者Linux都自帶，存取下來供後續分析，程式碼如下：

def saveData(item):
        related_tags = ''
        conn = sqlite3.connect('/Users/kumufengchun/maimai.db')
        cursor = conn.cursor()
        for tag in related_tags:
                print(tag)
                sys.exit()
                related_tags += tag['name'] + ','
        ins = "insert into gossip values(null,?,?,?,?,?,?)"
        v=(item['text'] if(item.has_key('text')) else '',
        item['author'] if(item.has_key('author')) else '',
        item['name'] if(item.has_key('name')) else '',
        item['avatar'] if(item.has_key('avatar')) else '',
        related_tags,
        item['time'] if(item.has_key('time')) else '')
        cursor.execute(ins, v)
        conn.commit()
        conn.close()

資料分析

資料存取下來了，就可以分析了，每個崗位發貼數量，用tableau簡單的作圖表如下圖：

製作雲圖

想了解大家都在聊啥，用jieba分詞先把帖子內容分詞，然後在用wordcloud作雲圖，程式碼如下：

def makeYuntu():
        conn = sqlite3.connect('/Users/yangjiao/maimai.db')
        c = conn.cursor()
        cursor = c.execute("select text from gossip")
        f = ''
        for row in cursor:
                text = jieba.cut(row[0], cut_all=False)
                f +=" ".join(text)
        wordcloud = WordCloud(
                font_path="Deng.ttf",
                background_color="white",
                width=1920,
                height=1080,
                margin=2).generate_from_text(f);
        plt.imshow(wordcloud)
        plt.axis("off")
        plt.show()
        wordcloud.to_file('maimai.png')
        conn.close()

製作的雲圖如下所示

好了，第一次抓取資料的嘗試就到這了。

關於模擬瀏覽器登入的有很多方法參考文件：https://www.cnblogs.com/chenxiaohan/p/7654667.html

關於sqlite的學習使用：http://www.runoob.com/sqlite/sqlite-python.html

關於python的使用：http://www.runoob.com/python3/python3-if-example.html

關於wordcloud的學習：https://blog.csdn.net/cy776719526/article/details/80171790

　　　　　　　　　　　https://www.cnblogs.com/jlutiger/p/9176517.html

關於jieba的學習：https://blog.csdn.net/linzch3/article/details/71253541

參考愛奇藝的爬取資料：https://blog.csdn.net/csdnnews/article/details/84781953

職場社交軟體脈脈職言區最近一個星期在聊什麼？

工作之餘在學習python,筆者主流語言是php,初學抓取了近來一個星期的脈脈職言區的帖子，現將過程記錄如下。脈脈是一款職場社交軟體，大家會在職言區，也就是之前的匿名區去吐槽，但是帖子是登入之後才能看，所以第一步需要python模擬登入模擬登入首先在網頁上登入，開啟開發者工具，會看

職場生存篇（關於能否混在一個公司）

公司裡面有各種各樣的人，就想唐憎四師徒取經一樣。有嬉戲玩鬧，也有勾心鬥角,職場生存能否生存得好，其實是一個很難講訴的一個話題，詩東本人見過各種各樣的人之後，感受了不少人間冷暖，下面從幾個方面敘述更多幹貨請關注微信公眾號：nedsoft 　 1.技術對於一個

職場老司機才知道的辦公軟體，PDF轉Word輕鬆搞定！

身在職場的小夥伴，都經歷過“小白”期：滿懷一腔熱血，各種埋頭苦幹，各種焦頭爛額，但是依然效率不高，只恨自己不是“三頭六臂”的哪吒。再看看職場“老司機們”都一個個遊刃有餘地向領導交出一份份漂亮的工作報告，是不是滿腹狐疑？其實你有沒有想過並不是你的能力低人一等，只是你沒用對辦公軟體而已。其實只要用對了

職場——自古深情留不住，唯有套路得人心

求職開始問題層次思想發的高薪功能招聘信息認知觀：北漂一趟，覺得收獲最大的就是更新了看待軟件開發的觀念。 1.中國不缺低端的技術人才，缺高端的技術人才。這意味著，首先你得一直呆在這個行業內（不轉行），然後出去平時完成的工作任務，自己還在持續的

你最該知道的事（職場）

() 相互 sharp 規律團隊 pre 單位學習就會以 ITer 的角度看，以下是個典型的基類聲明： class 職場人 { public const string 觀念 = "..."; public virtual void 方法();}

零基礎java培訓靠譜嗎？職場轉行，零基礎開始學Java開發靠譜嗎？

零基礎java培訓靠譜嗎 java零基礎招聘靠譜嗎零基礎java培訓靠譜嗎？職場轉行，零基礎開始學Java開發靠譜嗎？學技術轉行發展，是職場常見的提升方式，無論是在職充電還是為轉行跳槽做準備，選擇一個專業技能進行培訓學習，都是非常可取的。在能力至上的今天，單憑學歷已經不能成為入行敲門磚，特別是在互聯

【薦讀】《我的前半生》：無論哪個階層，這8條職場潛規則都終身受用

態度 mil 排列組合進階金錢 -c 收入我不 inline 【薦讀】《我的前半生》：無論哪個階層，這8條職場潛規則都終身受用 2017-07-19人民日報1職場沒有捷徑好走的路都不是坦途劇：做全職太太10年養尊處優的羅子君，早就和職場脫節，但為了與前夫爭奪兒子的

IT職場常見疾病之“脂肪肝”

降脂降脂總綱戒煙，戒酒，戒糖，低脂肪高纖維，減少精白細軟，增加維生素、礦物質和抗氧化成分，同時增加運動，生活作息協調規律，早睡早起。外面吃1、在外只吃五分飽，不可暴飲暴食。2、盡量不點油炸、油煎、香酥、幹鍋、水煮，多點蒸、煮、燉、涼拌。3、涼菜多點清爽生疏，主食多點五谷雜糧。4、盡量不要去KFC等快餐店

透過《我的前半生》悟出職場規則

我的前半生職場規則最近這個電視劇火的一塌糊塗，除了劇中的感情糾葛外，職場規則也是大家熱門討論的。看了很多文章說了很多道理，嗯，我就總結出一句職場規則：職場上必須有人！！！！！！哈哈哈，不要打我，我又真相了！當然，小弟在這裏還的傳播點正能裏，雖然現實就是這麽殘酷不公平，但我們仍要努力，得到了就好好珍

職場菜鳥新人的生存法則

dbd img write vdh uio targe sns tmc ffd copyonwritearraylist%E5%AE%9E%E7%8E%B0%E5%8E%9F%E7%90%86%E5%8F%8A%E6%BA%90%E7%A0%81%E5%88%86%E6%9

【執行力決定命】第14集《職場五大溝通習慣》

執行力、職場、習慣、目標、升職、加薪「音頻原文」http://dwz.cn/6sB6v2大家好，我是林琳笨，今天跟大家一起分享《職場5大溝通習慣》，最近經常收到粉絲後臺留言，問我職場中如何溝通，我回想了下，至少有20種方法，今天和大家分享5個我認為比較重要的點。分別是：數字說話、直接回答問題、再次確認、每天通

職場英語修煉手冊

englishUnit 01 認識同事與自我介紹Unit 02 會見直屬上司Unit 03 介紹公司人事規章Unit 04 職前工作說明Unit 05 受邀與同事共進午餐Unit 06 實際接觸工作Unit 07 征詢同事意見Unit 08 領取辦公用品本文出自 “Gorilla City” 博客，請務必保留

職場與個人

溝通關系做到事件職場向上犯錯如果內容職場與個人： 1）工作； 2）人際關系；（現在） 3）學習；（中長期） 4）家庭；（一生）；我是誰：定位自己。（我、組織、人、事、場合、溝通鍛煉、犯錯、自我調整、合作）。盧恩光：合作與溝通自我管

單身職場人士怎麽利用晚上時間提高自己？

避免料理辦公裏的平時作者能夠軌跡所有單身職場人士怎麽利用晚上時間提高自己？時間：2014-03-12 00:23 來源：互聯網的一些事作者：知乎--Cher Deo 　　時間就是海綿裏的水，也是平胸的乳溝。能做更多的事情，並不一定是比別人有

30-35歲職場規劃深談，字字戳心

思想目標轉發跳槽提升是不是體系人在知識體系轉發+點贊=支持百度搜索：小強測試品牌交流群：522720170 你所有不曾料想過的問題，都會隨著時間的推移而與你不期而遇；你所有曾經瀟灑的隨遇而安，同樣也會隨時間流逝而讓你承擔那些似乎命中已經註定的代價。

進入職場必讀，一個職場人的工作感悟

做成決心可能成就上風思考人的基礎沒有一個人應盡自己最大的努力，發掘自己所有的潛力來實現自己的幻想，努力可能會失敗，但廢棄則象征著你基本不可能成功。一個人要麽把握很好的專業技巧，要麽控制在生涯中無孔不入的本事。這兩者都是生財之道。一個人要一直晉升本人

3星|《好好工作》：適合職場新手看的工作原則

es2017 心理普通人針對做出心理學下一步信息感受作者是專業職業咨詢顧問。看全書內容作者的咨詢對象以職場新手為主，因此作者的經驗也是針對職場新手的通用的原則。總體來說職場新手還是可以看一看的。我評3星。以下是書中一些信息的摘抄： 1：工作實際和職

十種經典職場說話技巧

感覺進展能力逆反心理頭上如果自信可靠的確 1不要說“但是”，而要說“而且” 試想你很贊成一位同事的想法，你可能會說：“這個想法很好，但是你必須......”本來說話字字千金伶牙俐齒的你，這樣子一說，這種認可就大打折扣了。你完全可以說出一個比較具體的希望

Linux職場解讀：如何進入500強企業？

linux 職場職場解讀：如何進入500強企業？面試題：請解釋Linux中/dev/null和/dev/zero兩個文件的作用和區別。在類Unix操作系統中，設備節點並不一定要對應物理設備。沒有這種對應關系的設備被稱之為偽設備。操作系統運用了它們實現多種多樣的功能，/dev/null和/dev/ze

重構職場競爭力之測試職業發展困惑分析

重構職場競爭力之測試職業發展困惑分析重構職場競爭力之測試職業發展困惑分析因我們品課學院新開啟企業定制化性能測試培訓課程，意味著這些學員培訓完後，可以直接到有專業技能需求的

職場社交軟體脈脈職言區最近一個星期在聊什麼？

模擬登入

存取資料

資料分析

製作雲圖

相關推薦