集體智慧程式設計-皮爾遜相關係數程式碼理解

剛開始看關於皮爾遜相關係數計算的程式碼，把我看得是暈頭轉向，不過在學習完概率論的課程後，發現結合公式再來看程式碼就會比較簡單了。

期望公式

E(x)=1n∑i=1nxi
方差公式
var(x)=E{[x−E(x)]2}
=E{x2−2x×E(x)+[E(x)]}
=E(x2)−2E(x)E(x)+[E(x)]2
=E(x2)−[E(x)]2
期望性質
E(c)=c
因此對於上訴方差推導公式
E{−2x×E(x)}=−2E(x)E(E(x))=−2E(x)E(x)
因為
E(x)=c
即
E{E(x)}=E(x)
推導方差公式有利於下面皮爾遜相關係數的推導
皮爾遜相關係數計算公式

pxy=cov(x,y)var(x)var(y)−−−−−−−−−−−√
協方差公式
cov(x,y)=E{[x−E(x)][y−E(y)]}
=E{XY−XE(Y)−YE(X)+E(X)E(Y)}
=E(XY)−E(X)E(Y)
書中第三章關於皮爾遜相關係數的程式碼如下

sum1 = sum(v1)
sum2 = sum(v2)
sum1sq = sum([pow(v, 2) for v in v1])
sum2sq = sum([pow(v, 2) for v in v2])
pSum = sum([v1[i]*v2[i] for i in range(len(v1))])
num 
 = pSum - (sum1*sum2/len(v1))
den = sqrt((sum1sq - pow(sum1, 2)/len(v1)) * (sum2sq - pow(sum2, 2)/len(v)))
if den == 0:
    return 0
return num/den

變數的意義（i=j）為了公式推導方便，在下面的式子中會用i代替j

sum1

sum1=∑i=1nxi
sum2
sum2=∑j=1nyj
sum1sq
sum1Sq=∑i=1nx2i
sum2sq
sum2sq=∑j=1nyj2
psum
psum=∑i=1nxiyi
num
num=∑i

=1nxiyi/n−∑i=1nxi

集體智慧程式設計-皮爾遜相關係數程式碼理解

剛開始看關於皮爾遜相關係數計算的程式碼，把我看得是暈頭轉向，不過在學習完概率論的課程後，發現結合公式再來看程式碼就會比較簡單了。

集體智慧程式設計-皮爾遜相關係數程式碼理解

Pearson(皮爾遜)相關係數

皮爾遜相關係數和餘弦相似度

【126】TensorFlow 使用皮爾遜相關係數找出和標籤相關性最大的特徵值

推薦演算法之-皮爾遜相關係數計算兩個使用者喜好相似度

如何通俗易懂地理解皮爾遜相關係數？

資料探勘之曼哈頓距離、歐幾裡距離、明氏距離、皮爾遜相關係數、餘弦相似度Python實現程式碼

皮爾遜相關係數定義+python程式碼實現（與王印討論公式）

利用皮爾遜相關係數找出與目標最相關的特徵（Python實現）

皮爾遜相關係數的計算(python程式碼版)

marchine learning 之皮爾遜相關係數

①協方差、相關係數（皮爾遜相關係數），等同於：內積、餘弦值。

相似度演算法之皮爾遜相關係數

【機器學習】歐幾里德距離和皮爾遜相關係數（筆記）

Spark/Scala實現推薦系統中的相似度演算法（歐幾里得距離、皮爾遜相關係數、餘弦相似度：附實現程式碼）

皮爾遜相關系數理解

皮爾遜相關系數

皮爾遜相關系數和余弦相似性的關系

【Python學習筆記】使用Python計算皮爾遜相關系數

皮爾森相關係數演算法

集體智慧程式設計-皮爾遜相關係數程式碼理解

剛開始看關於皮爾遜相關係數計算的程式碼，把我看得是暈頭轉向，不過在學習完概率論的課程後，發現結合公式再來看程式碼就會比較簡單了。

相關推薦