FM(Factorization Machine)

引子

機器學習的通常模式為學習輸入到輸出的變換，比如最常見的線性迴歸模型，輸入為X，輸出為Y，通常輸入為高維資料，X是一個向量,形式如下：

y=w1x1+w2x2+...+wnxn

線性迴歸是最簡單的線性模型，只能捕捉最簡單的一階線性關係，而且基於各特徵獨立同分布的假設。

實際中，各特徵x1,x2,...xn並不是相互對立的，一般有些特徵是相互影響的。此時就需要用多項式迴歸去建立模型，捕捉這些特徵之間的相互影響。

一般為了簡單，會只捕捉二階的關係，即特徵間兩兩相互影響的關係，如下：

y=w0+∑j=1pwjxj+∑j=1p∑i

=jpwj,ixjxi
這裡每兩個特徵有一個引數w要學習。

這裡仍有問題，對於二項式迴歸來說，如果有n個特徵，那麼要學習到兩兩之間的關係，有n(n−1)/2個引數要去學習，對於實際中的複雜任務來說，n的值往往特別大，會造成要學習的引數特別多的問題。
同時，又由於實際資料會有稀疏性問題，有些特徵兩兩同時不為0的情況很少，當一個數據中任何一個特徵值為0的時候，那麼其他特徵與此特徵的相互關係將沒有辦法學習。

FM原理

受到矩陣分解的啟發，為了解決上述兩個問題，引入了因子分解機。

如果訓練的輸入資料有n個特徵，設i,j兩個特徵的相互關係用引數wi,j表示，那麼有wi,j=wj,i, 這樣所有w的引數值會形成一個對稱的矩陣，如下：
none w

1,2 w1,3 w1,4 … w1,n
w2,1 none w2,3 w2,4 … w2,n
…
wn,1 wn,2 wn,3 … wn,n−1 none

缺失了對角線的矩陣，正因為如此，我們可以通過給對角線任意設定值來保證矩陣為半正定矩陣，自然想到了矩陣分解。

基於矩陣分解的思想，將以上矩陣分解為兩個低階矩陣的乘積，那麼在分解過程中，不僅僅減少了資料儲存的複雜度，而且多了一個特別神奇的功能，預測功能。

矩陣分解基於一個假設，即矩陣中的值等於學習到的兩個隱向量的乘積，即

wi,j=vivj
這裡vi,vj為學習到的隱向量。
那麼因子分解機的形式為：
y=w0+∑j=1

pwjxj+∑j=1p∑i=j+1pxjxi∑f=1kvj,fvi,f
其中，vj,f,vi,f分別為特徵i,j對應隱向量的一個隱因子。
通常，由於資料稀疏，本來wi,j是學習不到的，但是我們可以通過i特徵與其他特徵的資料，j特徵與其他特徵的資料，分別學習到i,j特徵的引數向量vi,vj，這樣wi,j通過vivj的乘積便可以預測wi,j的值，神奇地解決了資料稀疏帶來的問題。

而且，一般隱向量維度k遠遠小於特徵數量n，那麼分解後要學習的引數數量為：n∗k,對比多項式迴歸的引數數量n

FM（因子分解機系列）

FM(Factorization Machine)

引子

FM原理

FM（因子分解機系列）

FM（Factorization Machine，因子分解機）演算法個人理解

因子分解機（libffm+xlearn）

ml課程：FM因子分解機介紹及相關程式碼

UVa 10780 Again Prime? No Time.（因子分解）

因子分解機(FM) +場感知分解機 (FFM) 入門

因子分解機FM原理及SGD訓練

因子分解機 FM和FFM

萬字長文，詳解推薦系統領域經典模型FM因子分解機

Docker4Windows -- 從外部（非本機host）訪問由docker container運行的程序

（luogu題解搬運系列）luogu p2651 添加括號Ⅲ

（luogu題解搬運系列）luogu p1459 三值的排序

NOIP模擬階乘（質因數分解+二分答案）

FPGA自動售賣機（verilog狀態機設計）

jk——Git+Github+Springboot+Idea關於第一次自己搭專案（搭建微服務系列）

機器學習筆記（八）-吳恩達視訊課程（支援向量機SVM）

什麼是執行緒？（java基礎總結系列）

簡單易學的機器學習演算法——因子分解機(Factorization Machine)

【LeetCode & 劍指offer刷題】回溯法與暴力列舉法題2：12 矩陣中的字串查詢（79. Word Search 系列）

java 字串忽略大小寫排序（華為機試）

FM（因子分解機系列）

FM(Factorization Machine)

引子

FM原理

相關推薦