1. 程式人生 > >推薦系統論文筆記(2):Towards the Next Generation of Recommender Systems:A Survey of the State-of-the-Art ....

推薦系統論文筆記(2):Towards the Next Generation of Recommender Systems:A Survey of the State-of-the-Art ....

一、基本資訊

論文題目:《Towards the Next Generation of Recommender Systems:A Survey of the State-of-the-Art and Possible Extensions》

發表時間:July 2005,IEEE Transactions on Knowledge and Data Engineering 17(6):734-749

論文作者及單位:Gediminas Adomavicius(University of Minnesota)Alexander Tuzhilin(NYU)

論文地址:https://ieeexplore.ieee.org/document/1423975

我的評分:5顆星

  •  

二、摘要

  本篇論文對當前(2005年)推薦系統領域的研究做了梳理,將它們劃分為了三大類:基於內容過濾、協同過濾、混合推薦。同時也描述了這些不同方法的侷限與不足,並討論了針對這些侷限幾種可能的改進。

 

三、論文的工作

1、將推薦系統方法劃分為了三大類:

  • Content-based recommendations:基於內容過濾,使用者U將被推薦和過去買過的物品I具有相似特點的物品I1
  • Collaborative recommendations:協同過濾,使用者U將被推薦和他具有相似愛好的使用者U1購買過的物品I
  • Hybrid approaches:將內容過濾和協同過濾方法結合

2、詳細介紹了三種方法的原理與各自的侷限

  • Content-based Methods:受系統所能從物品中提取的特徵數量限制,難以對物品進行詳盡的描述;無法區分待推薦物品的優劣;推薦閉環問題,即使用者會一直被推薦與已買過的物品相似的物品,難以發現新的特徵不同的物品;冷啟動中的新使用者問題,一個使用者必須要有物品的購買記錄才能被推薦。
  • Collaborative Methods:協同過濾的演算法可分為兩大類:memory-based(or heuristic-based)和model-based。具有冷啟動的新使用者和新物品問題,一個使用者需要有已購物品的記錄才能收到推薦,一樣物品只有被人購買過才會被推薦給其他使用者;資料稀疏問題,物品種類很多,而使用者之間重合購買過的卻很少,因此使用者間的相似度矩陣維度很高,而有用的資訊在其中卻只佔很小的一部分。
  • Hybrid Methods:將內容過濾與協同過濾結合起來的方法可以分為四類:

               (1)將兩種方法單獨實現,將它們預測出的結果進行合併。

               (2)將內容過濾中商品的一些特性加入到協同過濾中

               (3)將協同過濾中的一些特性加入到內容過濾中

               (4)建立一個聯合的模型,將兩種方法融合在一起

3、提出了7個可以對現有方法改進的方向

  • 提高推薦模型對使用者和物品的理解,更加深入理解和商品的特徵,將使用者與商品的特徵融入推薦系統
  • 對現有基於模型的推薦演算法進行擴充套件,比如將數學近似理論等理論引入推薦演算法
  • 在推薦過程中引入上下文資訊,不僅考慮使用者與商品這兩個維度的資訊,還可以嵌入季節、場所等資訊
  • 支援使用者對物品的多個方面進行評分,比如對餐廳而言可分為食物、服務、環境三個方面分別評分
  • 提供對使用者更少影響的推薦方法,最小化對使用者打擾的同時儘可能提高推薦系統輸入資訊的有效性。比如原本推薦系統的輸入是使用者對某物品的評分,可以更改為使用者在某商品介面停留的時間
  • 提高推薦系統的靈活性,大多數推薦系統採用在使用者與物品之間“硬連線”的方法,因此使用者不能根據自己的需求定製推薦。比如一個使用者希望獲得一份從A地到B地自駕遊的推薦,“硬連線”的推薦演算法便缺少這種將全過程相關物品聚合推薦的能力
  • 改進對推薦系統評估的測度指標

 

四、總結

儘管是一篇發表在十多年前的文章,這篇論文中不少對推薦系統改進的建議已經成功實現,但還有很多設想對今天的推薦系統研究任然具有重要的啟示。此外這篇文章還對基於內容過濾與協同過濾的原理進行了詳細的數學上的描述,由於篇幅限制故本篇筆記中沒有貼出。