1. 程式人生 > >大資料——個性化推薦系統

大資料——個性化推薦系統

要知道什麼是個性化推薦系統,那麼就要先了解什麼是推薦系統:

  • 什麼是推薦系統

推薦系統就是利用電子商務網站或APP向客戶提供商品資訊和建議,有意地引導使用者的意向,幫助使用者決定應該購買什麼產品,模擬銷售人員幫助客戶完成整個購買過程。而個性化推薦系統是根據使用者的興趣特點和購買行為,向用戶推薦使用者感興趣的資訊和物品,使使用者產生購買的意向。如果這些你對沒有一個確切的概念,那麼說購物網站上面每次所向你一些你從來沒買過的物品,你就很清晰了。

為什麼會出現推薦系統?

  • 資訊過載問題

主要是由於現在這個資訊爆炸時代,資訊過多,使得使用者無法從大量資訊中無法獲得對自己有用的資訊,對資訊的使用降低。

  • 長尾問題

冷門商品的經濟匯聚起來,可與主要商品的經濟相匹敵。

推薦系統的組成:

使用者建模模組、推薦物件模組、推薦演算法模組

  • 個性化推薦系統的主要推薦演算法

什麼是協同過濾?

利用興趣相投、擁有共同經驗之群體的喜好來推薦使用者感興趣的資訊,對資訊的迴應來幫助別人篩選資訊,以達到過濾的目的。

個性化推薦系統分別是以下規則所構成的,分別為:

  • 基於物品的協同過濾

蒐集購物籃資料——根據物品相似度模型——根據物品相似度推薦

優點:在基於使用者的基礎上進行的改良,物品的機制比使用者的機制更為準確

缺點:需要有歷史資料,不夠靈活。

  • 基於使用者的協同過濾

根據使用者的偏好模型——找到相似使用者群——根據相似使用者推薦

優點:可能會發現使用者的潛在興趣,對使用者分類更為準確。

缺點:對新使用者有冷啟動問題,使用者資料過大,對使用者的喜好需要實時更新。

  • 基於內容的推薦

根據物品資訊建模——計算物品的相似度——根據相似物品推薦

優點:不需要其他使用者的資料,只需要使用者自己本身的資料,不存在資料的冷啟動問題及稀疏問題。

缺點:需要對物品進行分析建模,依賴物品的完整程度,不考慮使用者的喜好。

  • 基於人口統計學的推薦

根據使用者資訊進行建模——計算使用者的相似度——根據相似使用者推薦

優點:不需要當前使用者對物品喜好的歷史資訊,不依賴物品本身。

缺點:需要收集使用者的一些敏感資訊,分類比較粗糙,無法對一些如電影或音樂進行建模。還有使用者的資訊有可能會變更。