1. 程式人生 > >推薦系統實踐---第六章:利用社交網路資料

推薦系統實踐---第六章:利用社交網路資料

下面簡單介紹書中提到的問題以及有哪些解決辦法,方便大家對正本書有個整體的把握,同時我也會上傳這本書的高清PDF版,本來想不用積分下載,但是系統最少2個,要是哪位沒有積分,可以私信我。下載連結如下:

其他章節內容


美國著名的第三方調查機構尼爾森調查了影響使用者相信某個推薦結果的因素,90%的使用者詳細朋友對他們的推薦。基於社交網路的推薦可以很好的模擬現實社會。所以利用社交網路資料進行推薦可以增加使用者對系統的信任度。另外利用使用者在社交網路的資料可以解決冷啟動問題。

6.1    獲取社交網路資料的途徑

主要方式:電子郵件(聯絡人);使用者在系統的註冊資訊(居住地和工作地);使用者的位置資訊(網頁的IP和手機的GPS);論壇和討論組(豆瓣);即時聊天工具(QQ);社交網站(以Twitter為代表的興趣圖譜和以Facebook為代表的社交圖譜)。

6.2    社交網路資料簡介

用圖定義社交網路:用圖G(V,E,w)定義一個社交網路,V表示頂點集合,表示使用者,E是邊集合,表示兩個使用者是否有關係,w表示了邊的權重。以Facebook為代表的需要雙向確認的網路,可以用無向圖表示;以Twitter為代表的社交網路只需要單方面關注,所以需要用有向圖表示。

社交網路資料:雙向確認;單向關注;基於社群的社交網路資料(同一個公司的人);

社交網路資料中的長尾分佈:使用者的出度和入度都服從長尾分佈。橫座標表示出度x,縱座標表示出度為x的使用者的數量f(x)。

6.3    基於社交網路的推薦

基於社交網路的推薦演算法:基於領域的推薦;基於圖的推薦;

資訊流推薦:每個使用者都有一個資訊牆,展示了使用者的好友最近的言論。資訊流的個性化推薦就是進一步幫助使用者從資訊牆中挑選有用的資訊。目前最流行的資訊流推薦演算法時Facebook的EdgeRank。

6.4    給使用者推薦好友

好友推薦演算法再社交網路被稱為鏈路預測,這裡討論比較簡單和直觀的演算法。

基於內容的匹配:常用內容屬性包括,使用者的人口統計學屬性;使用者的興趣(喜歡的物品和釋出過的言論);使用者的位置資訊;

基於共同興趣的好友推薦:利用UserCF的思想,如果兩個使用者喜歡相同的物品(比如微博),就說明他們具有相似的興趣;此外,也可以根據使用者在社交網路中的發言提取使用者的興趣標籤,來計算使用者的興趣相似度。

基於圖的還有推薦:通過使用者u和使用者v的出度和入度,定義Wuv。根據相似度Wuv進行推薦。