基於使用者的協同過濾演算法的電影推薦系統

阿新 • • 發佈：2019-01-31

上一篇講解了推薦演算法的分類，這裡電影推薦系統具體分析一下

第一步：建立使用者電影矩陣模型

如表1所示，協同過濾演算法的輸入資料通常表示為一個m*n的使用者評價矩陣Matrix，m是使用者數，n是電影數，Matrix[ij]表示第i個使用者對第j個電影的評價：

第二步：發現興趣相似的使用者

這一階段，主要完成對目標使用者最近鄰居的查詢，通過計算目標使用者與其他使用者之間的相似度，得到與目標使用者最近的鄰居集。度量使用者間相似性：設N(u)為使用者u喜歡的電影集合，N(v)為使用者v喜歡的電影集合，將上一步中每行記錄視為一個向量，那麼u和v的相似度可通過以下進行計算：
(a)採用Jaccard公式：W_uv=(|N(u)∩N(v)|)/(|N(u)∪N(v)|)
(b)餘弦相似度計算：W_uv=(|N(u)∩N(v)|)/(√|N(u)||N(v)|)
這裡選擇餘弦公式進行相似度度量計算，假設目前共有4個使用者(A、B、C、D)，5部電影(a、b、c、d、e)，使用者與電影的關係如下圖所示：

W_AB=(|{a,b,d}∩{a,c}|)/(√|{a,b,d}||{a,c}|)=1/(√6) W_AC=(|{a,b,d}∩{b,e}|)/(√|{a,b,d}||{b,e}|)=1/(√6) W_AD=(|{a,b,d}∩{c,d,e}|)/(√|{a,b,d}||{c,d,e}|)=1/3

而這種方法的時間複雜度是O(|U|*|U|)，所以非常耗時。而在上表中可以看到“使用者-電影”表是一個稀疏矩陣，即很多時候N(u)^N(v)=0，如果換一下思路，可以首先計算N(u)^N(v)!=0的使用者，然後再計算sqrt(N(u)*N(v))。為此可以首先建立“電影-使用者”的倒排表，對每部電影都儲存電影到使用者的列表：

設稀疏矩陣C[u][v]=N(u)^N(v)，在倒排索引中假設使用者u和使用者v同時屬於倒排索引中K部電影對應的使用者列表，就有C[u][v]=K。例如上圖所示只有電影a中同時出來了使用者有A和使用者B，則在矩陣中賦值為1：

到此，使用者間的相似度計算就得到了，可以很直觀的找到與目標使用者興趣相似的使用者。

第三步：產生推薦專案

需要從矩陣中找到與目標使用者最相似的K個使用者，用集合S(u,K)表示，將S中使用者喜歡的電影全部提取出來，併除去u已經喜歡的電影。對每個候選電影i，使用者對它的感興趣的程度用以下公式計算：

（其中Rvi表示使用者v對電影i的喜歡程度，此處舉例全部為1，在電影評分時應該代入使用者的評分）。
繼續上面的例子，假設我們給A推薦電影，選取K=3，對使用者A，電影c、e沒有看過，因此可以將這兩部電影推薦給使用者A，根據UserCF演算法使用者A對物品c、e的興趣分別計算p(A,c)和p(A,e)：

p(A,c)= W_AB+W_AD=1/(√6)+1/3=0.7416
p(A,e)= W_Ac+W_AD=1/(√6)+1/3=0.7416 所以使用者A對電影c和e的喜歡程度可能一樣，在真實的推薦系統中計算時考慮使用者的評分，最後根據得分排序取前K個即為推薦電影

基於使用者的協同過濾演算法的電影推薦系統

基於協同過濾演算法構建推薦系統

簡單的協同過濾演算法程式碼推薦系統

python資料分析：基於協同過濾的電影推薦演算法

基於協同過濾演算法的推薦

基於使用者的協同過濾來構建推薦系統

基於Python庫surprise的電影推薦系統

基於Spark MLlib平臺和基於模型的協同過濾演算法的電影推薦系統（一）協同過濾演算法概述&&基於模型的協同過濾的演算法思想（演算法模型和結構待補充）

基於使用者的協同過濾演算法的電影推薦系統

基於使用者的協同過濾演算法實現的商品推薦系統

推薦系統（一）基於協同過濾演算法開發離線推薦

吳恩達機器學習（十四）推薦系統（基於梯度下降的協同過濾演算法）

Java推薦系統-基於使用者的最近鄰協同過濾演算法

基於近鄰使用者協同過濾演算法的音樂推薦系統

推薦系統學習--基於item的協同過濾演算法及python實現

協同過濾Item-based演算法實現電影推薦系統

《推薦系統》基於使用者和Item的協同過濾演算法的分析與實現（Python）

《推薦系統實踐》——基於物品的協同過濾演算法（程式碼實現）

推薦系統實踐----基於使用者的協同過濾演算法（python程式碼實現書中案例）

推薦系統中協同過濾演算法實現分析（重要兩個圖！！）

[機器學習]推薦系統之協同過濾演算法

基於使用者的協同過濾演算法的電影推薦系統

相關推薦