1. 程式人生 > >Recsys2018 總結 (推薦系統最新技術、應用和方向)32篇論文解讀

Recsys2018 總結 (推薦系統最新技術、應用和方向)32篇論文解讀

本文對10月2-7號在加拿大渥太華舉辦的Recsys的32篇論文做了整理和歸納,總結出了目前推薦系統最新技術應用和方向。並對每一篇文章做了粗略的講解。
在這裡插入圖片描述
我打算從以下四個方面來講述這32篇論文。

  • 首先呢,我會概述一下大會論文反映的一些情況。

  • 然後分析一下這些論文中用到的技術、應用的場景以及資料集。

  • 再將這32篇論文分類並詳細的講述一下。

  • 最後對著32篇論文如何去解決推薦中的經典問題,做一個總結。

把對我們有用的論文總結出來,供大家後續研究。
在這裡插入圖片描述
首先我來概述一下這次會議錄用論文的情況。
這一次長文投稿181篇,接受了32篇,錄用率18%。

看完這些論文,最最重要的一個感覺是,這個會議更在乎研究的問題是什麼?是否有意義,是否新穎有趣.
我感覺這個會議沒有那麼注重演算法上的創新。而更多的是討論某個具體的推薦場景下問題如何解決。
很多的工作都是將一些已有的方法進行變形之後,應用到新的更具體的問題上。 所以我感覺對於推薦系統大會來說,好的問題是文章成功的一半。
下面這三點是這次大會論文錄用比較多的三個點。

  • 首先說一下可解釋性。可解釋性無非就是讓使用者知道推薦系統為什麼給給我推這個。
    最近幾年越來越多的推薦演算法開始注重推薦結果的可解釋性,希望能與使用者產生溝通交流,直接增強使用者體驗,使用者體驗好了之後,使用者愛用了就間接的增強了推薦效果。
  • 另外一個呢就是推薦結果的公平性和多樣性。
    如果我們在推薦中呢,只考慮推薦的準確性,那麼方法很容易就陷入一個單一類別的區域性最優解。會議上的有很多有趣的工作,就是說用bandit等演算法引入多樣性。
    公平性呢,是一個暫時沒有具體的衡量標準問題。如果只用均衡來作為標準的話,多樣性和公平性其實是一致的。 也就是說多樣了,也就意味著我公平了。
  • 最後呢,還要說一下強化學習。最大會有六篇文章,用了強化學習的方法。下一步呢,我也想將畢業題目定為基於強化學習的推薦演算法的研究。

在這裡插入圖片描述

下面呢,我要從這三個方面分析一下這次大會將推薦系統應用的場景以及最新用到的一些技術,還有資料集。

在這裡插入圖片描述
這次推薦大會呢,錄用的新問題很多,所以應用場景很多,尤其是新的場景特別多。 比較新的像是英雄推薦遊戲裡的英雄推薦,然後電信移動服務商裡的電信繫結套餐業務推薦。以及像百度地圖中的交通路線推薦還有就是問答系統中回答問題的專家推薦。還有互補商品推薦。互惠推薦,多角色推薦。
在這裡插入圖片描述
再說一下出現的技術。
因為解決的問題多種多樣,用到的技術也很多,這裡並沒有把所有的技術放在這兒,具體的哪篇論文用到了哪個技術還要在後面具體的說。
給我印象比較深的呢,就是強化學習用到的比較多。
在這裡插入圖片描述
最後說一下資料集的情況。
資料集依場景的不同和方法而不同。這裡總結了這麼幾個。
在這裡插入圖片描述


這一部分呢,將會對32篇論文概括的講述一下。
我主要將這32篇論文分為五個方面。

  • 第一個部分呢,就是先講述一下這次大會提出的新的應用場景。 總共有九篇論文,佔了大會全部論文的28%。

  • 第二部分呢,再講一下關於多樣性和公平性的論文, 總共有六篇論文佔了全部大會,全部論文到19%。

  • 第三部分呢,要講述一下推薦系統中可解釋性的論文, 總共有三篇論文,佔了全部大會論文的10%。

  • 第四部分的,講述一下推薦輔助相關的論文。

    推薦輔助是啥意思呢?就是說這些論文不是直接的提出新的推薦演算法,而是對已有的推薦演算法進行了研究,發現其中的一些問題。

  • 最後呢講述一下,提出的新演算法來改進已有的推薦場景的論文。

總共有九篇文章,佔了大會全部論文的28%。
在這裡插入圖片描述

這一部分呢,是新問題的一些論文。
第一篇我要講述的論文是這篇。

作者的問題很新。
作者希望用系統生成新的物品。生成的物品呢,能夠讓使用者都喜歡。

作者舉了一個真實場景的例子。比如說呢,設計團隊想要設計一款手機,讓所有的人都喜歡。像iPhone樣,就是做一個大家都喜歡的手機。無論賣菜的老大媽,是文藝青年還是學生啊這些群體都喜歡。
作者要解決的問題呢,就是要覆蓋所有使用者群體的興趣。

這篇文章基本的想法呢,就是使用變分自動編碼器vae,首先將使用者和物品的特徵放入這個隱因子的空間裡。然後使用貪婪演算法,在隱因子空間中選點,然後覆蓋所有的使用者,最後通過decoder產生新的item。

在這裡插入圖片描述

這一頁呢是另外的三個新問題。

第五篇呢是交通推薦的問題。啥是交通推薦的問題呢?就是像百度地圖呀,谷歌地圖呀,給使用者推薦出行的路線。
這篇文章的作者同樣是推薦路線。但他不同的是,它不像百度地圖,谷歌地圖這樣推薦哪些路線最快。哪些路線收費最低。
他推薦的是哪些路線更舒服。作者總結了幾個影響路線舒適度的因子。設計了一個推薦演算法。進行推薦。評價標準呢,是找了50個人。調查了一下。這50個人說你這個APP比谷歌地圖1批推薦的路線更舒適。並且舒適30%。

這個第六篇。是京東投稿的。

他的新場景主要是一個頁面推薦。
需要用一個頁面覆蓋住使用者最感興趣的不同分類的東西。
然後要做到實時的反饋。就是使用者跑出去購物回來再看這個頁面就變了。作者用強化學習解決了這個問題。

第13篇,是問答系統中預測最佳回答者。
這個場景,就像知乎問答似的。知乎裡有很多人提問題。但是很多問題得不到解決。需要一種推薦回答的演算法。

作者用了learn to rank結合各種推薦演算法(包括文字的標籤的使用者行為的)來找問題的最佳的回答者。

在這裡插入圖片描述
第19篇。多角色推薦

多角色推薦是什麼呢?像京東里的賣家和買家。有的賣家他身兼多職,既是買家又是賣家。這種單使用者帶有多個角色的,就叫多角色推薦。像知乎裡的回答者和觀看答案的人。
作者提出了上面這個門模型,解決了這個問題。

第21篇呢,是一個電信服務套餐繫結的場景。
像我們移動聯通電信這些運營商會有一些特殊的套餐推薦給使用者。比如這個使用者常用愛奇藝可以給他推薦一個愛奇藝,免流量的這麼一個套餐。
這篇文章就是解決了一個這樣的問題。

第29篇。這是一個遊戲中英雄陣容推薦的。
moba就是多人線上對抗的遊戲。lol王者榮耀這種遊戲。
這種遊戲一般分成兩個隊伍。每個隊伍有五個人。當每個隊伍中都有一個人選擇了英雄的時候。這個推薦系統就會推薦下面的人選擇什麼英雄勝率比較高。
在這裡插入圖片描述
第23篇,它是一個互惠推薦系統。

像我們日常生活中用的探探boss直聘,這些軟體中有兩兩方面的使用者。像探探這種線上約會的軟體,男的是一方,女的是一方。要給男的推薦女的,又要給女的推薦男的。這樣給雙方推薦的就是一個互惠的推薦。
像boss直聘也是一樣,就要給老闆推薦員工,也要給員工推薦老闆提供的職位。
在這裡插入圖片描述
第26篇呢,是一個物品互補的推薦。

向我們購買商品時。買了一個相機。這個時候呢,像相機套呀,鏡頭呀,自拍控制桿呀,鏡頭套呀,這些東西就可以被推薦了。
互補推薦系統會在這裡面給我們推薦一些我們最可能買的。
在這裡插入圖片描述
到這裡呢,全部的九個新問題就說完了,
下面開始講推薦系統中的多樣性和公平性的問題。
第14篇文章講了一個演算法混淆的概念。
什麼是演算法混淆呢。
我在日常生活中就遇到過。就是我在bilibili上看了幾個學習的視訊。然後呢,我下一次再去這個應用程式。他就一直給我推的視訊。我就沒法再看其他的視訊了。我就一直看學習的視訊。然後他還一直推學習的視訊,竟然陷入了一個惡性迴圈中。
這樣呢,推薦系統就增加了同質性,喪失了多樣性。降低他的推薦效果。
作者在這篇文章中詳細的說明了這個演算法混淆是如何危害我們的。
‌後面的幾篇文章就是解決這個演算法混淆帶來同質性的問題。
在這裡插入圖片描述
第二篇文章呢提出了一個calibrated的概念。
calibrated的是什麼呢?
它是按比例推薦。也就是說使用者看了99%的學習的。看了1%的娛樂的。
如果是一般的推薦系統,就只給使用者推薦他主要的興趣。
而這裡按比例推薦的,就是遵從以前的使用者看的這個比例。也給使用者推99%學習的和1%娛樂的。這樣做到了多樣性。

第四篇文章
作者講述了一個這樣的問題。
就是很多推薦系統呢,為了某些商業的目的,如何增加點選率和下載量,試圖改變使用者本身的自然行為,所以我們看到使用者點選或者是下載的時候,其實是已經受了推薦演算法影響的。這個問題其實就是一個演算法混淆的問題。
在這裡呢,作者利用因果推理的這麼一個技術,在這裡也用到了強化學習,然後消除了演算法帶來的誤差。

下面是第九篇文章。
第九篇文章呢是社交網路中連結的推薦。
作者通過一個弱關係的推薦還增強了推薦的多樣性。
這篇文章的能對我們的好友推薦,有借鑑意義。
在這裡插入圖片描述
第11篇文章是
作者發現圖書推薦中對圖書作者性別推薦呈現出歧視女性的現象,本文講述了這些推薦系統是如何的歧視女性。

第31篇論文的是改進了一個 AOA的評估器。
使推薦系統免受流行度偏差的影響。
在這裡插入圖片描述

這些呢,就是對所有的多樣性和公平性文章的一個講解。

下這一部分是推薦系統的可解釋性。

第32篇論文
這篇論文作可解釋性的主要思路是從評論中生成對使用者行為的解釋。

模型下面呢,是輸入使用者的評論和物品的評論。我的評論就是這個使用者對所有的物品的評論物品的評論呢就是這個物品被所有的使用者的評論。

然後這個模型引入了上下文感知擴充套件的概率矩陣分解
又結合從評論文當中學習的文字特徵,
最後預測的評級以及對評級的解釋。
在這裡插入圖片描述
第十篇論文呢
主要思想是利用bandit對推薦的解釋。
強化學習裡的兩個概念探索和利用。探索呢就是把不確定使用者喜不喜歡的商品推薦給使用者。來探索使用者到底喜歡啥。利用呢就是說從使用者已知的使用者喜歡的東西里找到使用者最喜歡的。

第25篇論文呢,是對互惠推薦系統做解釋。
右圖中呢,作者對互惠推薦系統的解釋,做了一個展現。
給這個使用者推薦這個女的是因為喜歡西班牙語藝術,然後學識還高,所以給這個男的推薦這個女的。是這樣作出的解釋。

在這裡插入圖片描述
這篇論文和前面講到第23篇論文是同一批人做的
師兄跟我們說,讓我們好好努力,然後一塊兒把咱們的APP放上去(學術頭條https://www.acheadline.com),發一批論文,起到一個廣告效應。
在這裡插入圖片描述

到這裡呢,可解釋向他推薦就說完了,下面呢要說一下輔助推薦的一些方法。

第八篇文章
作者對推薦系統中什麼時候用成對的偏好做了一個調查。
得到的結論是在主動搜尋的時候,也就是說目標明確的時候,用成對的偏好資料效果更好。
在這裡插入圖片描述
第七篇文章呢,
講了一個使用者控制對推薦的影響。
使用者控制呢,就是說讓使用者在介面上可以選擇,我不喜歡這篇文章這種。
作者在文中找到了一個這樣使用者用的開心又能推薦的好的一個平衡點。

第17篇文章
我們在使用推薦系統時,經常關注的是使用者的反饋,就像使用者的點選使用者的打分呀。而作者呢,是從使用者沒有操作的角度來分析。浙江使用者的不作為分為了七類,然後將推薦問題轉化成一個分類問題。

第18篇論文主要研究了物品相似度演算法與推薦質量的關係。

得到了一個結論,基於內容的推薦演算法,在相似度和推薦質量方面要優於基於使用者行為的。

第22篇論文呢是對Top推薦中應用的資訊檢索6個評價的指標進行了一個魯棒性和辨別力能力的一個調查。
結果顯示precision 魯棒性最好。NDCG有最好的辨別力。
在這裡插入圖片描述

輔助推薦的論文就講完了,下面講述改進推薦演算法的論文。

第20篇論文呢,
主要思想呢就是利用評論評論來進行評分預測。
創新點 高斯混合模型代替了矩陣分解來進行評分的預測。

模型的輸入是一個使用者對物品的所有評論。以及一個物品被所有使用者的評論。最後得到這個使用者對這個物品的評分。
我覺得前部分是對評論進行embeding 後面的部分呢是輸入到高斯混合模型中,得到結果。

第二張圖呢,就是高斯混合模型。

在這裡插入圖片描述

在這裡插入圖片描述

第一篇文章呢,
講述了一個實時的推薦。
在這個推薦中呢,還解決了冷啟動問題。
作者利用了一個滑動視窗的機制檢測新資料的到來。
然後利用增量的矩陣分解和主題模型,實時對新資料進行推薦,生成評分。

第三篇文章呢,是講如何將分類資訊用於推薦

第15篇文章
這篇文章提出了一個單調行為鏈的概念。
作者發現評論行為暗含著購買行為,進一步暗含著點選行為。
作者開發了一種利用這種依賴關係的新演算法來進行推薦。

在這裡插入圖片描述

第16篇文章呢,
講了利用bandit來解決使用者行為稀疏的問題。
設計了一種新的深度神經記憶增強機制,通過使用者歷史行為來建模使用者的歷史狀態,從而在少量的互動中快速的學習使用者對新專案的偏好。

第24篇文章主要解決冷啟動問題。
通過一個靜態偏好問卷,然後獲得使用者的相對偏好,從而產生推薦。

在這裡插入圖片描述
第27篇文章適用知識圖譜來解決推薦問題
第28篇文章適用二分圖來解決推薦問題。
作者將使用者和商品之間的關係構成了二部圖,然後提出了譜域的普卷積運算元不僅可以揭示圖中臨近的資訊,而且可以揭示隱藏在圖中的連線資訊。
然後作者構建了深層的推薦模型,譜協同過濾。
這樣就可以發現使用者和商品之間的深層連線進而緩解能啟動問題。

第30篇文章
講述了一個用於序列推薦的演算法。
這個演算法將轉移和度量的方法與因子分解及模型結合起來。
利用平方歐式距離來計算特徵之間互動的強度。不用內積
還將內容的特徵融入進去,提升了推薦的效果。

在這裡插入圖片描述

總結。

給他推薦系統中存在的問題三個主要問題
冷啟動問題,多樣性性和公平性問題,可解釋性問題。
解決這些問題的方法有這些。
在這裡插入圖片描述
這裡總結了一些其他分類論文的編號
APP(學術頭條https://www.acheadline.com)
在這裡插入圖片描述
在這裡插入圖片描述