KNN-K最近鄰（k-NearestNeighbor)分類演算法

阿新 • • 發佈：2019-01-20

參考：https://baike.baidu.com/item/鄰近演算法/1151153?fr=aladdin&fromid=3479559&fromtitle=knn

https://www.cnblogs.com/ybjourney/p/4702562.html

kNN演算法的核心思想是如果一個樣本在特徵空間中的k個最相鄰的樣本中的大多數屬於某一個類別，則該樣本也屬於這個類別，並具有這個類別上樣本的特性。該方法在確定分類決策上只依據最鄰近的一個或者幾個樣本的類別來決定待分樣本所屬的類別。 kNN方法在類別決策時，只與極少量的相鄰樣本有關。由於kNN方法主要靠周圍有限的鄰近的樣本，而不是靠判別類域的方法來確定所屬類別的，因此對於類域的交叉或重疊較多的待分樣本集來說，kNN方法較其他方法更為適合。

右圖中，綠色圓要被決定賦予哪個類，是紅色三角形還是藍色四方形？如果K=3，由於紅色三角形所佔比例為2/3，綠色圓將被賦予紅色三角形那個類，如果K=5，由於藍色四方形比例為3/5，因此綠色圓被賦予藍色四方形類。

K通常是不大於20的整數。KNN演算法中，所選擇的鄰居都是已經正確分類的物件。該方法在定類決策上只依據最鄰近的一個或者幾個樣本的類別來決定待分樣本所屬的類別。

KNN演算法不僅可以用於分類，還可以用於迴歸。通過找出一個樣本的k個最近鄰居，將這些鄰居的屬性的平均值賦給該樣本，就可以得到該樣本的屬性。更有用的方法是將不同距離的鄰居對該樣本產生的影響給予不同的

權值(weight)，如權值與距離成反比。

在KNN中，通過計算物件間距離來作為各個物件之間的非相似性指標，避免了物件之間的匹配問題，在這裡距離一般使用歐氏距離或曼哈頓距離：

接下來對KNN演算法的思想總結一下：就是在訓練集中資料和標籤已知的情況下，輸入測試資料，將測試資料的特徵與訓練集中對應的特徵進行相互比較，找到訓練集中與之最為相似的前K個數據，則該測試資料對應的類別就是K個數據中出現次數最多的那個分類，其演算法的描述為：

1）計算測試資料與各個訓練資料之間的距離；

2）按照距離的遞增關係進行排序；

3）選取距離最小的K個點；

4）確定前K個點所在類別的出現頻率；

5）返回前K個點中出現頻率最高的類別作為測試資料的預測分類。

優點：

1.簡單，易於理解，易於實現，無需估計引數，無需訓練； 2. 適合對稀有事件進行分類； 3.特別適合於多分類問題(multi-modal,物件具有多個類別標籤)， kNN比SVM的表現要好。缺點：該演算法在分類時有個主要的不足是，當樣本不平衡時，如一個類的樣本容量很大，而其他類樣本容量很小時，有可能導致當輸入一個新樣本時，該樣本的K個鄰居中大容量類的樣本佔多數。該方法的另一個不足之處是計算量較大，因為對每一個待分類的文字都要計算它到全體已知樣本的距離，才能求得它的K個最近鄰點。演算法改進：主要分成了分類效率和分類效果兩方面。分類效率：事先對樣本屬性進行約簡，刪除對分類結果影響較小的屬性，快速的得出待分類樣本的類別。該演算法比較適用於樣本容量比較大的類域的自動分類，而那些樣本容量較小的類域採用這種演算法比較容易產生誤分。分類效果：採用權值的方法（和該樣本距離小的鄰居權值大）來改進，Han等人於2002年嘗試利用貪心法，針對檔案分類實做可調整權重的k最近鄰居法WAkNN (weighted adjusted k nearest neighbor)，以促進分類效果；而Li等人於2004年提出由於不同分類的檔案本身有數量上有差異，因此也應該依照訓練集合中各種分類的檔案數量，選取不同數目的最近鄰居，來參與分類。

KNN-K最近鄰（k-NearestNeighbor)分類演算法

KNN-K最近鄰（k-NearestNeighbor)分類演算法

《演算法圖解》第10章 K最近鄰（K nearest neighbors,KNN）演算法

斯坦福CS231n專案實戰（一）：k最近鄰（kNN）分類演算法

K最近鄰（KNN）

python機器學習庫sklearn——K最近鄰、K最近鄰分類、K最近鄰迴歸

K--最鄰近（K-NN）演算法

基於TensorFlow的最近鄰（NN）分類器——以MNIST識別為例

關於K最近鄰分類演算法（KNN）的綜述

第九章 KNN（K最近鄰分類演算法）

PCB 加投率計算實現基本原理--K最近鄰算法（KNN）

資料探勘之k-最近鄰法（KNN與KMeans）

K最近鄰演算法（KNN）---sklearn+python實現

分類（2）：k-最近鄰、貝葉斯分類器

機器學習教程四.KNN（k最近鄰）演算法理解和應用

K最近鄰演算法（KNN）

機器學習與資料探勘-K最近鄰(KNN)演算法的實現（java和python版）

機器學習之K-最近鄰規則分類(KNN)演算法

在Ignite中使用k-最近鄰(k-NN)分類演算法

在Ignite中使用k-最近鄰(k-NN)分類算法

機器學習分類演算法之K近鄰（K-Nearest Neighbor）

KNN-K最近鄰（k-NearestNeighbor)分類演算法

相關推薦