協同過濾的ALS演算法

原文地址：http://blog.csdn.net/antkillerfarm/article/details/53734658

ALS演算法原理

上面的網頁概括了ALS演算法出現之前的協同過濾演算法的概況。

ALS演算法是2008年以來，用的比較多的協同過濾演算法。它已經整合到Spark的Mllib庫中，使用起來比較方便。

從協同過濾的分類來說，ALS演算法屬於User-Item CF，也叫做混合CF。它同時考慮了User和Item兩個方面。

使用者和商品的關係，可以抽象為如下的三元組：<User,Item,Rating>。其中，Rating是使用者對商品的評分，表徵使用者對該商品的喜好程度。

假設我們有一批使用者資料，其中包含m個User和n個Item，則我們定義Rating矩陣Rm×n，其中的元素rui表示第u個User對第i個Item的評分。

在實際使用中，由於n和m的數量都十分巨大，因此R矩陣的規模很容易就會突破1億項。這時候，傳統的矩陣分解方法對於這麼大的資料量已經是很難處理了。

另一方面，一個使用者也不可能給所有商品評分，因此，R矩陣註定是個稀疏矩陣。矩陣中所缺失的評分，又叫做missing item。

這裡寫圖片描述

針對這樣的特點，我們可以假設使用者和商品之間存在若干關聯維度（比如使用者年齡、性別、受教育程度和商品的外觀、價格等），我們只需要將R矩陣投射到這些維度上即可。這個投射的數學表示是：

Rm×n≈Xm×kYTn×k(1)

這裡的≈表明這個投射只是一個近似的空間變換。

不懂這個空間變換的同學，可參見《機器學習（十二）》中的“奇異值分解”的內容，或是本節中的“主成分分析”的內容。

一般情況下，k的值遠小於n和m的值，從而達到了資料降維的目的。

這裡寫圖片描述

幸運的是，我們並不需要顯式的定義這些關聯維度，而只需要假定它們存在即可，因此這裡的關聯維度又被稱為Latent factor。k的典型取值一般是20～200。

這種方法被稱為概率矩陣分解演算法(probabilistic matrix factorization，PMF)。ALS演算法是PMF在數值計算方面的應用。

為了使低秩矩陣X和Y儘可能地逼近R，需要最小化下面的平方誤差損失函式：

minx∗,y∗∑u,i is known(rui−xTuyi)2

考慮到矩陣的穩定性問題，使用Tikhonov regularization，則上式變為：

minx∗,y∗L(X,Y)=minx∗,y∗∑u,i is known(rui−xTuyi)2+λ(|xu|2+|yi|2)(2)

優化上式，得到訓練結果矩陣Xm×k,Yn×k。預測時，將User和Item代入rui=

基於使用者的協同過濾和基於物品的協同過濾推薦演算法圖解

在協同過濾中，有兩種主流方法：基於使用者的協同過濾，和基於物品的協同過濾。具體怎麼來闡述他們的原理呢，看個圖大家就明白了基於使用者的 CF 的基本思想相當簡單，基於使用者對物品的偏好找到相鄰鄰居使用者，然後將鄰居使用者喜歡的推薦給當前使用者。計算上，就是將一個使用者對所有物品

協同過濾(ALS)

Spark ALS演算法進行矩陣分解，U * V = Q 如果資料不是執行在叢集上，而是執行在本地，為了保證記憶體充足，在啟動spark-shell時需要指定引數--driver-memory 6g。資料集藝術家點播資料集: 使用者

協同過濾推薦演算法詳解

一、什麼是協同過濾？協同過濾是利用集體智慧的一個典型方法。要理解什麼是協同過濾 (Collaborative Filtering, 簡稱 CF)，首先想一個簡單的問題，如果你現在想看個電影，但你不知道具體看哪部，你會怎麼做？大部分的人會問問周圍的朋友，看看最近有什麼好看的電影推薦，而我們一般更傾向於從

基於譜聚類SM演算法的協同過濾推薦演算法研究——清華師兄畢業論文學習

一、個性化推薦演算法 1.相似度的比較兩個商品或者商品之間相似的的計算方法，量化屬性為非數值型資料的商品或者使用者之間的接近程度。通常我們計算使用者或者專案間相似度的主要方法有餘弦相似度（Cosime Similarity）、Jaccard係數和pearson相關(pearson Corr

使用Python的Pandas庫實現基於使用者的協同過濾推薦演算法

本文在下文的程式碼基礎上修改而來：環境版本 Python 3.5.5 Pandas 0.22.0 import pandas as pd df = None def dataSet2Matrix(

協同過濾推薦演算法的優化（稀疏矩陣的處理）

簡單的協同過濾演算法流程如下（1）、計算其他使用者和你的相似度，可以使用反差表忽略一部分使用者（2）、根據相似度的高低找出K個與你最相似的鄰居（3）、在這些鄰居喜歡的物品中，根據鄰居與你的遠近程度算出每一件物品的推薦度（4）、根據每一件物品的推薦度高低給你推薦物品。

推薦演算法概述：基於內容的推薦演算法、協同過濾推薦演算法和基於知識的推薦演算法

所謂推薦演算法就是利用使用者的一些行為，通過一些數學演算法，推測出使用者可能喜歡的東西。推薦演算法主要分為兩種 1. 基於內容的推薦基於內容的資訊推薦方法的理論依據主要來自於資訊檢索和

協同過濾(ALS)的原理及Python實現

提到ALS相信大家應該都不會覺得陌生（不陌生你點進來幹嘛[捂臉]），它是協同過濾的一種，並被整合到Spark的Mllib庫中。本文就ALS的基本原理進行講解，並手把手、肩並肩地帶您實現這一演算法。原理篇我們用人話而不是大段的數學公式來講講ALS是怎麼一回事。 1.1 你聽說過推薦演算法麼假

協同過濾推薦演算法之Slope One的介紹

Slope One 之一 : 簡單高效的協同過濾演算法(轉)( 原文地址：http://blog.sina.com.cn/s/blog_4d9a06000100am1d.html 現在做的一個專案中需要用到推薦演算法, 在網上查了一下. Beyo

基於使用者(user-based)的協同過濾推薦演算法的初步理解以及程式碼實現

總論協同過濾是目前最經典的推薦演算法。分而理之，協同，指通過線上資料找到使用者可能喜歡的物品；過濾，濾掉一些不值得推薦的資料。協同過濾推薦分為三種類型。第一種是基於使用者(user-based)的協同過濾，第二種是基於專案(ite

基於使用者的協同過濾推薦演算法原理和實現

在推薦系統眾多方法中，基於使用者的協同過濾推薦演算法是最早誕生的，原理也較為簡單。該演算法1992年提出並用於郵件過濾系統，兩年後1994年被 GroupLens 用於新聞過濾。一直到2000年，該演算法都是推薦系統領域最著名的演算法。本文簡單介紹基於使用者的協同

基於Spark MLlib平臺和基於模型的協同過濾演算法的電影推薦系統（一）協同過濾演算法概述&&基於模型的協同過濾的演算法思想（演算法模型和結構待補充）

本文暫時分為三部分：（一）基於Spark MLlib平臺和基於模型的協同過濾演算法的電影推薦系統（一） → 協同過濾演算法概述&&基於模型的協同過濾的演算法思想（二）基於Spark MLlib平臺和基於模型的協同過濾演算法的電影推薦

機器學習演算法（推薦演算法）—協同過濾推薦演算法(2)

一、基於協同過濾的推薦系統協同過濾(Collaborative Filtering)的推薦系統的原理是通過將使用者和其他使用者的資料進行比對來實現推薦的。比對的具體方法就是通過計算兩個使用者

基於社交網路的使用者與基於物品的協同過濾推薦演算法-java

完整工程+資料來源：https://github.com/scnuxiaotao/recom_sysimport java.io.BufferedReader; import java.io.FileNotFoundException; import java.io.Fil

mahout推薦演算法——協同過濾推薦演算法（java程式碼實現）

什麼是協同過濾協同過濾是利用集體智慧的一個典型方法。要理解什麼是協同過濾 (Collaborative Filtering, 簡稱 CF)，首先想一個簡單的問題，如果你現在想看個電影，但你不知道具體看哪部，你會怎麼做？大部分的人會問問周圍的朋友，看看最近有什麼好看的電影推

協同過濾推薦演算法-----向量之間的相似度

Collaborative Filtering Recommendation 度量向量之間的相似度方法很多了，你可以用距離（各種距離）的倒數，向量夾角，Pearson相關係數等。皮爾森相關係數計算公式如下： ρX,Y=cov(X,Y)σxσy=E((X−μx)

深入理解Spark ML：基於ALS矩陣分解的協同過濾演算法與原始碼分析

1. 引言隨著網際網路的迅猛發展,為了滿足人們在繁多的資訊中獲取自己需要內容的需求,個性化推薦應用而生。協同過濾推薦是其中運用最為成功的技術之一。其中,基於使用者的最近鄰法根據相似使用者的評分來預測當前使用者的評分。然而,在使用者數量以及使用者評分不

機器學習（十四）——協同過濾的ALS演算法（2）、主成分分析

Kendall秩相關係數（Kendall rank correlation coefficient）對於秩變數對(xi,yi),(xj,yj)： (xi−xj)(yi−yj)⎧⎩⎨>0,=0,<0,concordantneither con

機器學習（十三）——機器學習中的矩陣方法（3）病態矩陣、協同過濾的ALS演算法（1）

向量的範數（續）範數可用符號∥x∥λ表示。常用的有： ∥x∥1=|x1|+⋯+|xn| ∥x∥2=x21+⋯+x2n−−−−−−−−−−−√ ∥x∥∞=max(|x1|,…,|xn|) 這裡不做解釋的給出如下示意圖：其中，0範數表

協同過濾的ALS演算法

原文地址：http://blog.csdn.net/antkillerfarm/article/details/53734658 ALS演算法原理上面的網頁概括了ALS演算法出現之前的協同過濾演算法的概況。 ALS演算法是2008年以來，用

協同過濾的ALS演算法

ALS演算法原理

相關推薦