常見推薦演算法的總結
一、基於內容的推薦
通過對商品本身的特徵抽取、建立相似性列表、再利用使用者對商品的反饋(購物車、收藏),進行推薦
優點:可解釋、使用者獨立性強
缺點:難以挖掘使用者的隱藏興趣、個性化低、對新使用者存在冷啟動問題、特徵抽取工作量大、困難
二、基於使用者特徵的推薦——人口統計
利用使用者的統計特徵,如性別、年齡、職業等
缺點:難以挖掘使用者的真正的需求、個性化程度低
————以上兩種都是利用商品、人的本身屬性進行相似性的推薦,及本身屬性的相似度
三、協同過濾
——不抽取本身的屬性,利用使用者行為的相似度——依賴於行為資料
1)基於使用者的協同過濾
基於使用者行為的相似度,具有相同購物列表的使用者具有更高的相似性,可以進行交叉推薦
優點:適用於電子商務等大型資料場景、不用抽取專案本身特徵、個性化、可以挖掘要使用者潛在興趣、可以推薦多樣性,多領域的商品
缺點:冷啟動、依賴使用者行為資料——資料稀疏問題、對長尾商品難以挖掘
2)基於商品的協同過濾——電子商務系統使用最廣泛的演算法
——通過使用者行為度量商品的相似度,及大部分喜歡A商品的使用者同樣也喜歡B,則可以認為A和B相似,
找到使用者感興趣的商品的相似商品進行推薦
優缺點:與上面基本一致,不同:優點:可以挖掘長尾商品、缺:多樣性差
3)基於模型的協同過濾
——利用使用者行為來訓練使用者偏好模型才進行推薦(及不在利用相似度推薦、而是利用資料訓練一個判別模型直接產生結果)
方法:貝葉斯網路、隱語義模型、矩陣分解
優點:適用於資料稀疏的場景、不抽取本身特徵、個性化高、準確、可以挖掘使用者潛在興趣
缺點:訓練代價高、無法解決冷啟動問題
四、關聯分析——購物籃推薦
——利用關聯分析方法,找到關聯商品進行推薦
優點:可以發現新的興趣、不需要其他知識、不用抽取特徵
缺點:規則冗餘、質量難以保證
五、混合推薦
——常會吧協同過濾和其他推薦技術結合起來,解決冷啟動、資料稀疏問題