【閱讀筆記】Real-time Personalization using Embeddings for Search Ranking at Airbnb
阿新 • • 發佈:2018-11-27
Real-time Personalization using Embeddings for Search Ranking at Airbnb
Airbnb, Inc
KDD2018 ADS Track 的最佳論文
METHODOLOGY
Listing Embeddings
我們有使用者瀏覽的 session 資料,使用類似 skip-gram model 的方法來 embed 每條 listing,認為瀏覽過程中前後的 listing 是相似的,最大化:
但是 listing 太多,計算過於複雜。我們改變思路,生成正集合
(裡面的元素對在一個 session 視窗
內連續點選)和負集合
(裡面的元素為隨機取的),優化問題變為:
Booked Listing as Global Contex
對於最終預定的 session,我們任務瀏覽過程的 listing 與最後預定的 listing 也是相似的,多增加一項
Adapting Training for Congregated Search
因為隨機抽取的 ,所以大概率選取 來源於同一個 market, 來源於不同的 market,為了使得學習的 embedding 學到的不是 market 的資訊而是產品的資訊,所以我們隨機抽取同一市場的作為輔助負集合
Cold start listing embeddings
建立 listing 後,host 需要提供有關資訊,例如位置,價格,列表型別等。使用提供的元資料來查詢3個地理位置最接近(半徑10英里內)、其他型別也相似的、價格區間相同的 listing ,把這3個 listing 的 embedding 向量以形成新的 listing 的 embedding。 這樣我們能夠覆蓋超過98%的新 listing。
Examining Listing Embeddings
發現 embedding 確實有效,相似的 listing 有相近的 embedding。
User-type & Listing-type Embeddings
我們希望學習到不同市場(紐約和倫敦的房間)之間的 listing 之間的相似性。我們給定一個 user 的預定列表