1. 程式人生 > >聚類分析中的常見資料型別

聚類分析中的常見資料型別

聚類演算法中兩種有代表性的資料結構

(1)資料矩陣:用p個變量表示n個物件,每一行代表一個物件的p個屬性值,相當於一條記錄。

(2)相異度矩陣 dissimilarity matrix:存放n個物件兩兩之間的相異度的n*n個矩陣

其中d(i,j)表示物件i和物件j之間的相異度的數值,越相似越接近於0;反之,其值越大。顯然為下三角矩陣,d(i,j) =d(j,i)