1. 程式人生 > >常見推薦演算法的總結

常見推薦演算法的總結

一、基於內容的推薦

通過對商品本身的特徵抽取、建立相似性列表、再利用使用者對商品的反饋(購物車、收藏),進行推薦

優點:可解釋、使用者獨立性強

缺點:難以挖掘使用者的隱藏興趣、個性化低、對新使用者存在冷啟動問題、特徵抽取工作量大、困難

二、基於使用者特徵的推薦——人口統計

利用使用者的統計特徵,如性別、年齡、職業等

缺點:難以挖掘使用者的真正的需求、個性化程度低

————以上兩種都是利用商品、人的本身屬性進行相似性的推薦,及本身屬性的相似度

三、協同過濾

——不抽取本身的屬性,利用使用者行為的相似度——依賴於行為資料

1)基於使用者的協同過濾

基於使用者行為的相似度,具有相同購物列表的使用者具有更高的相似性,可以進行交叉推薦

優點:適用於電子商務等大型資料場景、不用抽取專案本身特徵、個性化、可以挖掘要使用者潛在興趣、可以推薦多樣性,多領域的商品

缺點:冷啟動、依賴使用者行為資料——資料稀疏問題、對長尾商品難以挖掘

2)基於商品的協同過濾——電子商務系統使用最廣泛的演算法

——通過使用者行為度量商品的相似度,及大部分喜歡A商品的使用者同樣也喜歡B,則可以認為A和B相似,

找到使用者感興趣的商品的相似商品進行推薦

優缺點:與上面基本一致,不同:優點:可以挖掘長尾商品、缺:多樣性差

3)基於模型的協同過濾

——利用使用者行為來訓練使用者偏好模型才進行推薦(及不在利用相似度推薦、而是利用資料訓練一個判別模型直接產生結果)

方法:貝葉斯網路、隱語義模型、矩陣分解

優點:適用於資料稀疏的場景、不抽取本身特徵、個性化高、準確、可以挖掘使用者潛在興趣

缺點:訓練代價高、無法解決冷啟動問題

四、關聯分析——購物籃推薦

——利用關聯分析方法,找到關聯商品進行推薦

優點:可以發現新的興趣、不需要其他知識、不用抽取特徵

缺點:規則冗餘、質量難以保證

五、混合推薦

——常會吧協同過濾和其他推薦技術結合起來,解決冷啟動、資料稀疏問題