1. 程式人生 > >社交網站的資料探勘與分析(高清版)PDF

社交網站的資料探勘與分析(高清版)PDF

社交網站的資料探勘與分析(高清版)PDF
百度網盤
連結:https://pan.baidu.com/s/1ia57ZMxvdTtq7eragsITzg
提取碼:5hth
複製這段內容後開啟百度網盤手機App,操作更方便哦
內容簡介 · · · · · ·
Facebook、Twitter和LinkedIn產生了大量寶貴的社交資料,但是你怎樣才能找出誰通過社交媒介正在進行聯絡?他們在討論些什麼?或者他們在哪兒?這本簡潔而且具有可操作性的書將揭示如何回答這些問題甚至更多的問題。你將學到如何組合社交網路資料、分析技術,如何通過視覺化幫助你找到你一直在社交世界中尋找的內容,以及你聞所未聞的有用資訊。
每個獨立的章節介紹了在社交網路的不同領域挖掘資料的技術,這些領域包括部落格和電子郵件。你所需要具備的就是一定的程式設計經驗和學習基本的Python工具的意願。
•獲得對社交網路世界的直觀認識
•使用GitHub上靈活的指令碼來獲取從諸如Twitter、Facebook和LinkedIn之類的社交網路API中的資料
•學習如何應用便捷的Python工具來交叉分析你所收集的資料
•通過XHTML朋友圈探討基於微格式的社交聯絡
•應用諸如TF-IDF、餘弦相似性、搭配分析、文件摘要、派系檢測之類的先進挖掘技術
•通過基於HTML5和JavaScript工具包的網路技術建立互動式視覺化
目錄 · · · · · ·
前言1
第1章緒論:Twitter 資料的處理9
Python 開發工具的安裝9
Twitter 資料的收集和處理11
小結24
第2章微格式:語義標記和常識碰撞26
XFN 和朋友27
使用XFN 來探討社交關係29
地理座標:興趣愛好的共同主線37
(以健康的名義)對菜譜進行交叉分析41
對餐廳評論的蒐集43
小結45
第3章郵箱:雖然老套卻很好用47
mbox:Unix 的入門級郵箱48
mbox+CouchDB= 隨意的Email 分析54
將對話執行緒化到一起70
使用SIMILE Timeline 將郵件“事件”視覺化79
分析你自己的郵件資料82
小結84
第4章Twitter :朋友、關注者和Setwise 操作85
REST 風格的和OAuth-Cladded API86
幹練而中肯的資料採集器90
友誼圖的構建108
小結116
第5章Twitter:tweet ,所有的tweet ,只有tweet 118
筆PK 劍:和tweet PK 機槍(?!?)118
對tweet 的分析(每次一個實體)121
並置潛在的社交網站(或#JustinBieber VS #TeaParty)144
對大量tweet 的視覺化155
社交網站的資料探勘與分析(高清版)PDF