1. 程式人生 > >歐式距離與餘弦相似度

歐式距離與餘弦相似度

歐氏距離

在歐幾里得空間裡面,點x =(x1,…,xn)和 y =(y1,…,yn)的歐幾里得距離為:
這裡寫圖片描述

歐幾里得距離關注的是同一個維度裡面,數值之間的差異。當不同維度的刻度差異較大,比如身高(m)和體重(kg),如果使用這兩個單位,歐式距離的變現出來的差異可能會沒有效果。
因此使用歐式距離時,一般需要先進行歸一化

餘弦相似度

計算空間兩個向量的夾角的餘弦值:
這裡寫圖片描述
餘弦值越大,夾角越小,也就是兩個向量的相似度越高;反之,餘弦值越小,相似度越低。
餘弦距離關注的是向量方向上的相似,而不是數值的差異。