最鄰近規則分類(K-Nearest Neighbor)KNN算法

阿新 • • 發佈：2018-08-23

bubuko rev created 換行差值 code 是否 clas 分隔

技術分享圖片

自寫代碼：

 1 # Author Chenglong Qian
 2 
 3 from numpy import *     #科學計算模塊
 4 import operator                  #運算符模塊
 5 
 6 def createDaraSet():
 7     group=array([[1.0,1.1],[1.0,1.0],[0,0],[0,0.1]])#創建4行2列的數組
 8     labels=[‘A‘,"A",‘B‘,‘B‘]#標簽列表
 9     return group,labels
10 
11 group,labels=createDaraSet()
 
12 
13 ‘‘‘k—近鄰算法‘‘‘
14 def classify0(inX,dataSet,labels,k):     #inX:需要分類的向量,dataSet：訓練樣本,labels：標簽,k：臨近數目
15     ‘‘‘求距離‘‘‘
16     dataSetSize=dataSet.shape[0]        #樣本數據行數，即樣本的數量
17     diffMat=tile(inX,(dataSetSize,1))-dataSet  #（來自numpy）tile：重復數組;將inX重復dataSetSize行,1列次；獲得每組數據的差值（Xi-X，Yi-Y）
18     sqDiffMat=diffMat**2                       # 
求平方
19     sqDistances=sqDiffMat.sum(axis=1)           #sum(axis=1)矩陣每一行相加，sum(axis=0)每一列相加
20     distances=sqDistances**0.5                  #開根號
21     sortedDistIndicies=distances.argsort()    #argsort()函數是將x中的元素從小到大排列，提取其對應的index(索引)，然後輸出到y。
22     classCount={}
23     ‘‘‘排序‘‘‘
24     for i in range(k):
 
25         voteIlabel=labels[sortedDistIndicies[i]]  #sortedDistIndicies[i]第i+1小元素的索引
26         classCount[voteIlabel]=classCount.get(voteIlabel,0)+1 #classCount.get(voteIlabel,0)返回字典classCount中voteIlabel元素對應的值,若無，則將其設為0
27                                                              #這裏表示記錄某一標簽的數量
28     sortedClassCount = sorted(classCount.items(), key=operator.itemgetter(1), reverse=True)#sorted（需要排序的list，key=自定義排序方式，是否反轉排序結果）
29                                                                                             #items 將字典以列表形式返回  （python3.5中無 ：iteritems將字典以叠代器形式返回）
30                                                                                             #itemgetter函數用於獲取對象的第幾維的數據 operator.itemgetter(1)使用第二個元素進行排序
31     return sortedClassCount[0][0]
32 
33 
34 ‘‘‘把文本記錄轉換成矩陣Numpy的解析程序‘‘‘
35 def file2matrix(filename):
36     fr=open(filename)
37     arrayOLines=fr.readlines()              #readlines()：返回由文件中剩余的文本（行）組成的列表
38     numberOfLines=len(arrayOLines)            #返回對象的長度
39     returnMat=zeros((numberOfLines,3))
40     classLabelVector=[]
41     index=0
42     for line in arrayOLines:
43         line=line.strip()                   #strip() 方法用於移除字符串頭尾指定的字符（默認為空格或換行符）或字符序列。
44         listFromLine=line.split(‘\t‘)          #split() 通過指定分隔符對字符串進行切片
45         returnMat[index,:]=listFromLine[0:3]
46         classLabelVector.append(int(listFromLine[-1]))
47         index+=1
48     return returnMat,classLabelVector

庫代碼

 1 from sklearn import neighbors
 2 from sklearn import datasets
 3 
 4 knn = neighbors.KNeighborsClassifier()
 5 
 6 iris = datasets.load_iris()
 7 
 8 print iris
 9 
10 knn.fit(iris.data, iris.target)
11 
12 predictedLabel = knn.predict([[0.1, 0.2, 0.3, 0.4]])
13 print "hello"
14 #print ("predictedLabel is :" + predictedLabel)
15 print predictedLabel

最鄰近規則分類(K-Nearest Neighbor)KNN算法

bubuko rev created 換行差值 code 是否 clas 分隔自寫代碼： 1 # Author Chenglong Qian 2 3 from numpy import * #科學計算模塊 4 import operat

4.1 最鄰近規則分類（K-Nearest Neighbor）KNN演算法

1968年提出的分類演算法輸入基於示例的學習（instance-based learning），懶惰學習（lazy learning）例子：演算法詳述步驟：為了判斷未知例項類別，用所有已知類別的例項作為參照選擇引數k 計算未知例項與所有已知例項的距離選擇

kNN(K-Nearest Neighbor)最鄰近規則分類

K最近鄰分類演算法方法的思路：如果一個樣本在特徵空間中的k個最相似（即特徵空間中最鄰近）的樣本中的大多數屬於這一類別，則該樣本也屬於這個類別。KNN演算法中，所選擇的鄰居都是已經正確分類的物件。該方法在定類決策上只依據最鄰近的一個或者幾個樣本的類別來決定待分類樣本所屬的類

機器學習演算法：kNN(K-Nearest Neighbor)最鄰近規則分類

KNN最鄰近規則，主要應用領域是對未知事物的識別，即判斷未知事物屬於哪一類，判斷思想是，基於歐幾里得定理，判斷未知事物的特徵和哪一類已知事物的的特徵最接近； K最近鄰(k-Nearest Neighbor，KNN)分類演算法，是一個理論上比較成熟的方法，也是最簡單的機器

【深度學習基礎-04】最鄰近規則分類（K Nearest Neighbor）KNN演算法

1 基本概念 Cover和Hart在1968年提出了最初的臨近演算法分類演算法classfication 輸入基於例項的學習instance-based learning ,懶惰學習lazy learning 2 例子： &n

2.最鄰近規則分類KNN演算法

1.綜述 2.例子未知的電影屬於什麼類別呢？ 3.演算法描述 3.3計算上述例子假設K為3，則選取最近的三個點，其中這三個點都是Romance則把未知電影歸類為Romance. 4.演算法的優缺點 5.考慮改進考慮權重，根據距離加上

機器學習分類篇-最鄰近規則分類KNN

最鄰近規則分類演算法(K-Nearest Neighbor)，Cover和Hart在1968年提出了最初的鄰近演算法，也被稱為基於例項的學習或懶惰學習，與決策樹演算法相比，處理訓練集的時候並不建立任何模型，進行分類時才將測試樣例和所有已知例項進行比較進而分類。

K近鄰法-k-nearest neighbor,KNN

WIKI In pattern recognition, the k-nearest neighbors algorithm (k-NN) is a non-parametric method used for classification and regression.[

KNN(k-nearest neighbor的縮寫)最近鄰演算法原理詳解

k-最近鄰演算法是基於例項的學習方法中最基本的，先介紹基於例項學習的相關概念。基於例項的學習已知一系列的訓練樣例，很多學習方法為目標函式建立起明確的一般化描述；但與此不同，基於例項的學習方法只是簡單地把訓練樣例儲存起來。從這些例項中泛化的工作被推遲到必須分類新的例

2-2 Python實現最鄰近規則KNN分類應用

最鄰近規則KNN分類應用資料集介紹虹膜 150個例項萼片長度，萼片寬度，花瓣長度，花瓣寬度 (sepal length, sepal width, petal length and petal width）類

K最近鄰(KNN,k-Nearest Neighbor)準確理解

用了之後，發現我用的都是1NN，所以查閱了一下相關文獻，才對KNN理解正確了，真是丟人了。左圖中，綠色圓要被決定賦予哪個類，是紅色三角形還是藍色四方形？如果K=3，由於紅色三角形所佔比例為2/3，綠色圓將被賦予紅色三角形那個類，如果K=5，由於藍色四方形比例為3/5，因此綠色圓被賦予藍色四方形類。

MachineLearning— (KNN)k Nearest Neighbor之最近鄰法原理舉例理解（一）

K近鄰法(k-nearest neighbor)是機器學習當中較為簡單理解的一種基本分類與迴歸方法，KNN輸入的是例項的特徵向量，也就是特徵空間上的點；輸出的是其對應的類別標籤，KNN的訓練資料集的

機器學習之K-最近鄰規則分類(KNN)演算法

準備分為兩個部分，一個是理論，一個就是程式碼實現。程式碼也可以在我的GitHub上下載，後面有連結。一、理論知識相信我的筆記還是比較詳細的二、程式碼實現KNN演算法 1. 首先要生成一些資料集，以供訓練和測試我造的資料是關於通過身高

機器學習實戰（一）k-近鄰kNN（k-Nearest Neighbor）

目錄 0. 前言 1. k-近鄰演算法kNN（k-Nearest Neighbor） 2. 實戰案例 2.1. 簡單案例 2.2. 約會網站案例 2.3. 手寫識別案例學習完機器學習實戰的k-近鄰演算法，簡單的做個筆記。文中

我的人工智慧之旅——近鄰演算法KNN（K-Nearest Neighbor）

在影象識別中，影象分類是首要工作。因為需要將不同型別的影象先進行排除。近鄰演算法是最簡單的演算法之一，但由於其弊端的存在，本篇只做瞭解性的簡單介紹， K近鄰演算法的實質將測試圖片在已經分類好的，具有不同標籤的訓練資料圖片中，找到K張最相似的圖片，進而根據K張圖片中型別的比例大小，推斷圖

《演算法圖解》第10章 K最近鄰（K nearest neighbors,KNN）演算法

今天看到這裡的案例非常有意思，即以座標軸中的座標來作為引數。計算不同點的距離。實際上就是標記一些使用者的喜好和習慣，不同的維度代表不同的專案，在這個維度上的值可表示喜好程度。電影評分、音樂收藏...總之，很多情況都可以用，很有趣。就是標記了很多使用者，看哪些使

machine learning Knn演算法最鄰近規則取樣（三）自己實現演算法

import csv import random import math import operator #匯入資料集,split將資料分為兩部分，訓練集和測試集 def loadDataset(filename,split,trainingSet=[],testSet=[]):

機器學習分類演算法之K近鄰（K-Nearest Neighbor）

一、概念 KNN主要用來解決分類問題，是監督分類演算法，它通過判斷最近K個點的類別來決定自身類別，所以K值對結果影響很大，雖然它實現比較簡單，但在目標資料集比例分配不平衡時，會造成結果的不準確。而且KNN對資源開銷較大。二、計算通過K近鄰進行計算，需要： 1、載入打標好的資料集，然

機器學習實戰（一）k-近鄰演算法kNN（k-Nearest Neighbor）

目錄 0. 前言簡單案例學習完機器學習實戰的k-近鄰演算法，簡單的做個筆記。文中部分描述屬於個人消化後的理解，僅供參考。如果這篇文章對你有一點小小的幫助，請給個關注喔~我會非常開心的~ 0. 前言 k-近鄰演算法kNN（k-Neare

最鄰近規則分類(K-Nearest Neighbor)KNN算法

相關推薦