1. 程式人生 > >文獻閱讀 BPR: Bayesian Personalized Ranking from Implicit Feedback

文獻閱讀 BPR: Bayesian Personalized Ranking from Implicit Feedback

論文介紹

這篇論文被UAI 2009收錄,這篇論文在推薦系統領域中非常經典,就算十年後的今天仍然能在不少論文中看到BPR的身影。

簡介和相關工作

推薦系統的任務是給使用者推薦一系列個性化的物品,之前人們從顯式反饋中做推薦的主要方法為矩陣分解(MF)和適應性K最近鄰(KNN)。但是這些方法都不是對物品排名做直接的優化。於是這篇文章提出了一種個性化排名的方法BPR-OPT,這種方法是基於貝葉斯理論的極大化後驗概率。使用者的顯式反饋一般從使用者與系統的互動行為中得出,比如使用者的購買歷史,觀看歷史等,這些很容易從後臺日誌中得到。

論文核心

U:表示使用者集合
I:表示專案集合
那麼


表示所有的顯式反饋,如圖所示:
在這裡插入圖片描述
本文定義了一種偏序關係>u,並且這種偏序關係具有三種特徵:完整性,反對稱性,傳遞性。這樣可以根據上圖的使用者物品顯性反饋矩陣,得到所有使用者的偏序矩陣。如下圖所示:
在這裡插入圖片描述
其中,?表示無顯性打分資料,+表示使用者比j偏愛i,-則相反。
如果使用者對查看了物品i2,但是沒有檢視專案i1,那麼可以確定使用者對於i1,更偏愛i2。但是如果使用者同時查看了i1和i2或者同時都沒有檢視,那麼就是無法確定是否i1和i2的偏序關係。該篇論文的訓練集為Ds:
在這裡插入圖片描述Ds是一個三元組(u,x,j)的集合。下面我們看看BPR-Optimization Criterion的推導公式:
在這裡插入圖片描述

表示使用者矩陣或者物品矩陣向量
在這裡插入圖片描述
此處是指示函式,當b為真的時候取1否則取0。
在這裡插入圖片描述
此處的啟用函式為sigmoid
BPR-OPT的推導過程如下:
在這裡插入圖片描述

滿足:
在這裡插入圖片描述

求偏導,有如下的訓練過程:
在這裡插入圖片描述
在這裡插入圖片描述
最後結合KNN和MF求出最終的物品排名