推薦系統：協同過濾之 Item-based Collaborative Filtering

阿新 • • 發佈：2019-01-02

說起 Item-based collaborative filtering，還有一段有意思的爭論，是關於它的起源的。

GroupLens 研究小組的 Sarwar 教授等人，於2001年5月在香港召開的第 10 屆 WWW 大會上，發表了題為《Item-based Collaborative Filtering Recommendation Algorithms》的 paper[1]。現在看來，這篇 paper 在 Item-based Collaborative Filtering 方面是影響最廣的，被引用的次數也最多，基本上見 Item-based 必見此文。在 2000 的時候，同是上文作者之一的 Karypis 曾經完成了《Evaluation of Item-based Top-N Recommendation Algorithms》，但它僅作為明尼蘇達計算機系的一篇 Technical Report 進行了發表，可以看作是 paper[1] 的工作基礎。

但實際上，早在 1998 年，Amazon 就已經開發出了自己的 Item-based 推薦系統，並投入了使用。同年，當時 Amazon 推薦系統的設計師、現在 Findory 的創始人 Greg，連同 Jacobi 和 Benson，使用“Collaborative Recommendations Using Item-to-Item Similarity Mappings”的名字對該項技術申請了專利。但該專利直到 2001 年才正式通過！並且在 Sarwar 等人的 paper[1] 裡，並沒有標明引用了此專利的內容。Greg 在自己的 blog 上專門撰文說明了此事 [1] [2]，並得到了 Economist 編輯 Tom Standage 的承認。在 2003 年，Greg 發表了題為《Amazon.com Recommendations: Item-to-Item Collaborative Filtering》的 paper，對 1998 年的專利內容進行了詳細的說明。

這是一段挺有意思的事情。但更能引起我興趣的，是這項已經被實踐證明確實行之有效的技術——Item-based (or item-to-item) collaborative filtering ！

Item-based 方法也有一個基本的假設：能夠引起使用者興趣的項，必定與其之前評分高的項相似。這個假設也是與我們日常生活中的行為相一致的，基本上喜歡《長尾理論》的人，都會去看《世界是平的》，不知道你怎麼想，反正豆瓣就是這麼認為的。

同 User-based 方法類似，Item-based 方法需要同樣的三個步驟：1）得到User-item的評分資料；2）針對項的最近鄰搜尋，即對項進行相似度計算；3）產生推薦。但相對於 User-based 方法，Item-based 方法最大的改進是提高了協同過濾方法的擴充套件性及效能。

從上一篇中可以看到，在 User-based 方法中，隨著使用者數量的不斷增多，在大數量級的使用者範圍內進行“最近鄰搜尋”會成為整個演算法的瓶頸。Item-based 方法通過計算項之間的相似性來代替使用者之間的相似性。對於項來講，它們之間的相似性要穩定很多，因此可以離線完成工作量最大的相似性計算步驟，從而大大降低了線上計算量，提高推薦效率。

在 Item-based 方法中，要對 A 和 B 進行項相似性計算，通常分為兩步：1）找出同時對 A 和 B 打過分的組合；2）對這些組合進行相似度計算，常用的演算法包括：皮爾森相關係數、餘弦相似性、調整餘弦相似性和條件概率等。

在 paper[1] 裡，Sarwar 教授通過試驗得到 Item-based 方法的推薦效果要略好於 User-based 方法的結倫。但其實這也並不盡然。在 2003 年，Mild 教授從批判的角度重新審視了各種推薦演算法，指出基於 Item-based 方法並不一定好，演算法準確度與採用的實驗資料資料有關，大多數情況下還是 User-based 方法好。我個人倒是認為，其實沒有絕對的好壞之分，而應該根據問題的不同和資料集的特點，選擇最合適的方法。

上面所說的偏重於學術界一些，演算法的出發點還是基於打分，多數使用的是 MovieLens 的資料。工業界實際使用的多是在基本 Item-based 方法基礎上的變形，例如基於關聯規則的方法，這些方法最大的變化就是在計算項的相似度方面做文章。其實正如 Greg 曾經說過的，協同過濾最大的特點是“以資料為先”的，只當有了大量的資料積累，才可能找到最有效的、最適宜的方法。

推薦系統：協同過濾之 Item-based Collaborative Filtering

說起 Item-based collaborative filtering，還有一段有意思的爭論，是關於它的起源的。 GroupLens 研究小組的 Sarwar 教授等人，於2001年5月在香港召開的第 10 屆 WWW 大會上，發表了題為《Item-based Collaborative Filteri

基於物品的協同過濾（item-based collaborative filtering)

姓名：wagsyang 日期：星期四, 08. 十二月 2016 08:26下午簡介本書是集體智慧程式設計一書的學習筆記。之前我們已經完成了基於使用者的協同過濾的推薦演算法，它的思想是將所有的使用者和自己對比，顯然對於小資料集還是

達觀資料推薦演算法實現：協同過濾之item embedding

推薦系統本質是在使用者需求不明確的情況下，解決資訊過載的問題，聯絡使用者和資訊，一方面幫助使用者發現對自己有價值的資訊，另一方面讓資訊能夠展現在對它感興趣的使用者面前，從而實現資訊消費者和資訊生產者的雙贏（這裡的資訊的含義可以非常廣泛，比如諮詢、電影和商品等，下

Music Recommendation System with User-based and Item-based Collaborative Filtering Technique(使用基於用戶及基於物品的協同過濾技術的音樂推薦系統)【更新】

effect 方向流動建議 comm 時代歌曲 .net man 摘要: 大數據催生了互聯網，電子商務，也導致了信息過載。信息過載的問題可以由推薦系統來解決。推薦系統可以提供選擇新產品（電影，音樂等）的建議。這篇論文會介紹一個音樂推薦系統，他會根據用戶的歷史行為和口味

斯坦福大學機器學習筆記——推薦系統（協同過濾、低秩分解、推薦系統）

這個部落格讓我們來討論一下推薦系統，首先我們來討論一下為什麼學習推薦系統： 1. 推薦系統是機器學習中的一個重要應用，它已經用於很多企業中，比如淘寶、今日頭條、亞馬遜等。它們會根據你的瀏覽記錄，當你再

【推薦系統】協同過濾

一、協同過濾：找到與某使用者有相同偏好的其它使用者，具體步驟： 1 收集使用者偏好（比如電影推薦時，某使用者對某電影的的打分，評論、轉發等） 2 找到相似的使用者或者物品 3 計算推薦基於使用者的協同過濾：計算使用者之間的相似度使用者A與使用者C很相似，

協同過濾中item-based與user-based選擇依據

此文總結的不錯。協同過濾是大家熟知的推薦演算法。總的來說協同過濾又可以分為以下兩大類： Neighborhood-based：計算相似item 或user後進行推薦Model-based：直接訓練模型預測Rating在Neighborhoold-based演算法

[論文筆記]Item-based collaborative filtering recommendation algorithms

作者：Badrul Sarwar, George Karypi, Joseph Konstan, John Riedl 內容概要 1. 協同過濾：目標：推薦TOP N item 類別：memory-based, model-based。 2. user-based的協同

推薦系統(recommender systems):預測電影評分--構造推薦系統的一種方法：協同過濾(collaborative filtering )

ring 愛情 span sys 結合 sub .cn style 分享協同過濾(collaborative filtering )能自行學習所要使用的特征如我們有某一個數據集，我們並不知道特征的值是多少，我們有一些用戶對電影的評分，但是我們並不知道每部電影的特征（即

基於使用者的協同過濾（user-based CF）推薦系統【2】

這一篇是緊跟著上一篇基於使用者的協同過濾（user-based CF）推薦系統【1】的，這一篇只是把計算相似度的方法換成了餘弦相似度，當然最後計算評分的公式也就變了。下面只把有變化的那部分程式碼貼出來。

《推薦系統》基於使用者和Item的協同過濾演算法的分析與實現（Python）

開啟微信掃一掃，關注《資料與演算法聯盟》1：協同過濾演算法簡介2：協同過濾演算法的核心3：協同過濾演算法的應用方式4：基於使用者的協同過濾演算法實現5：基於物品的協同過濾演算法實現一：協同過濾演算法簡介關於協同過濾的一個最經典的例子就是看電影，有時候不知道哪一部電影是

推薦演算法概述：基於內容的推薦演算法、協同過濾推薦演算法和基於知識的推薦演算法

所謂推薦演算法就是利用使用者的一些行為，通過一些數學演算法，推測出使用者可能喜歡的東西。推薦演算法主要分為兩種 1. 基於內容的推薦基於內容的資訊推薦方法的理論依據主要來自於資訊檢索和

協同過濾之三、基於RBM的推薦演算法

1、RBM用於協同過濾演算法介紹 Ruslan Salakhutdinov首次提出了使用RBM求解Netflix競賽中的協同過濾問題。其首先假設協同過濾系統中共有M個使用者以及N個專案，使用者對於某一個專案的偏好由評分表示（1分—K分，分別表示從不喜歡到喜歡的程度），因此可

新聞推薦系統：基於內容的推薦演算法（Recommender System：Content-based Recommendation）

2018/10/04更新這篇文章似乎被越來越多的小夥伴看到了，所以覺得有必要做一些進一步的詳細說明。首先按照本文所講解的推薦思路進行新聞推薦的推薦系統，我已經實現並已經放在Github上了。歡迎小夥伴們積極star和fork，更歡迎隨時提建議，我們一起交

Spark機器學習(11)：協同過濾算法

設置 tel println print emp master ani alt tro 協同過濾（Collaborative Filtering，CF）算法是一種常用的推薦算法，它的思想就是找出相似的用戶或產品，向用戶推薦相似的物品，或者把物品推薦給相似的用戶。怎樣評價用戶

推薦系統：矩陣分解與鄰域的融合模型

critical with 分析但是 rac 公式 download pearson 情況推薦系統通常分析過去的事務以建立用戶和產品之間的聯系，這種方法叫做協同過濾。協同過濾有兩種形式：隱語義模型（LFM），基於鄰域的模型（Neighborhood models）。

Spark MLlib協同過濾之交替最小二乘法ALS原理與實踐

請先閱讀leboop釋出的博文《Apache Mahout之協同過濾原理與實踐》。基於使用者和物品的協同過濾推薦都是建立在一個使用者-物品評分矩陣（user-item

推薦系統：MovivLens20M資料集解析

MovieLens 是歷史最悠久的推薦系統。它由美國 Minnesota 大學電腦科學與工程學院的 GroupLens 專案組創辦，是一個非商業性質的、以研究為目的的實驗性站點。MovieLens 主要使用 Collaborative Filtering

【推薦演算法】協同過濾演算法——基於使用者 Java實現

基本概念就不過多介紹了，相信能看明白的都瞭解。如果想了解相關推薦先做好知識儲備： 1.什麼事推薦演算法 2.什麼是基於鄰域的推薦演算法筆者選用的是GroupLens的MoviesLens資料傳送門GroupLens 資料集處理此處擷取資

推薦系統：協同過濾 之 Item-based Collaborative Filtering

相關推薦

推薦系統：協同過濾之 Item-based Collaborative Filtering