機器學習—推薦矩陣(2)

圖
這裡兩個矩陣,分別是使用者和標籤的關係,電影和標籤的關係。
我們得到兩張表,也可以理解兩個矩陣,一個是電影和標籤,一個是使用者和標籤,電影和標籤通過資料來表示電影和標籤的關係。

分類
通過這兩個矩陣我們可以得出使用者和電影的關係,我們如何看 Ana 對 M1 喜歡的程度,之前已經介紹過我們忽略不喜歡的標籤的評分所以是 3

圖
再看一看 betty 對 M1 喜歡程度為 1

分類
而 Dana 既喜歡動作又喜歡喜劇所以是 4。

結果

圖
我們通過這兩個推薦矩陣就可以得出使用者和電影的矩陣如右側的圖

圖

圖

圖

圖

圖
M1 和 M4 具有相同的評分。所以兩部電影為相同

圖

圖
從圖中可以看出 D 是 B 和 C 的和

圖
M2 和 M3 的平均值為 M5 的值。說了這麼多就是為了說明這兩個矩陣可以代替使用者和電影關係的矩陣,

圖

圖
需要矩陣來描述使用者對電影的關係,需要一個數組 1000 * 2000 的陣列。通過這樣一個數組來描述使用者喜歡電影的關係。

圖
這樣一來資料量達到了 2M 。

圖
用推薦矩陣好處是可以減少資料量,用兩個資料陣列來替換那個大陣列,也能起到同樣作用,好處通過兩個矩陣就來提到同樣效果。這樣大大減少資料量。

圖
我們通過用兩個矩陣來定位,獲取矩陣塊,所以這兩個推薦矩陣可以得出同樣效果。

圖
有的人喜歡看圖來理解一些概念,我們可以通過圖形來表示關係。我們用圖來表示使用者和電影的關係。

圖
我們用標籤將兩者,使用者和電影,串起來的,然後表示使用者和電影間的關係。

圖
對比一下兩個,可以很明顯右側的圖中關係線相對減少多了。

圖

圖
我們在此從資料考察一下,2000 * 1000 = 2M

圖
再看一看這張圖,從資料上看也少了很多。