KNN（K鄰近）演算法

阿新 • • 發佈：2018-12-31

k-鄰近演算法的一般流程

收集資料：可以使用任何方法
準備資料：距離計算（應該是計算距離）所需要的數值，最好是結構化的資料格式
分析資料：可以使用任何方法
訓練演算法：此步驟不適用與k-鄰近演算法
測試演算法：計算錯誤率
使用演算法：首先需要輸入樣本資料和結構化的輸出結果，然後執行k-鄰近演算法判定輸入資料分別屬於哪個分類，最後應用對計算出的分類執行後續的處理

# -*- coding: utf-8 -*-

# 建立名為kNN.py的Python模組
from numpy import * # 匯入科學計算包NumPy
import operator # 匯入運算子模組

# 匯入資料的函式，該函式返回 group 和 labels 

def createDataSet():
    group = array([[1.0,1.1],[1.0,1.0],[0,0],[0,0.1]])
    labels = ['A', 'A', 'B', 'B']
    return group, labels

def classify0(inX, dataSet, labels, k):
    dataSetSize = dataSet.shape[0] 
    # 計算array的維度,array(4,2),array.shape=(4,2),shape[0]=4
    #dataSetSize = 4

    diffMat = tile(inX, (dataSetSize, 1 
)) - dataSet 
    # tile功能是重複某個陣列,tile(A,n).tile(A,(2,1))重複得到的陣列是一個二維陣列
    # diffMat :
        # [-1. , -1.1],
        # [-1. , -1. ],
        # [ 0. ,  0. ],
        # [ 0. ,  0.1]

    sqDiffMat = diffMat ** 2 
    # 計算每個特徵值與inX點值的差值的平方
    # sqDiffMat:
        # [1. , 1.21],
        # [1. , 1.  ],
        # [0. , 0.  ], 

        # [0. , 0.01],

    sqDistances = sqDiffMat.sum(axis=1) 
    # sum of each row,if axis=0:sum of each column
    # sqDistances:
    # 該步驟的運算結果為：[ 2.21,  2.  ,  0.  ,  0.01]

    distances = sqDistances ** 0.5
    # 計算歐式距離，即xA(xA0, xA1)和xB(xB0, xB1)之間的距離
    # d = sqrt((xA0-xB0)^2) + (xA1-xB1)^2)
    # 例如：點(0, 0)與(1,2)之間的距離計算為：
    # sqrt( (1 - 0)^2 + (2 -0)^2 )
    # 這一步的運算結果為：[ 1.48660687,  1.41421356,  0.        ,  0.1       ]

    sortedDistIndicies = distances.argsort()
    # numpy.argsort(a, axis=-1, kind='quicksort', order=None)
    # 這一步的運算結果為：[2, 3, 1, 0]，即sortedDistIndicies[2] < sortedDistIndicies[3] < sortedDistIndicies[1] < sortedDistIndicies[0]，
    '''
        One dimensional array:
        >>> x = np.array([3, 1, 2])
        >>> np.argsort(x)
        array([1, 2, 0])

        Two-dimensional array:
        >>> x = np.array([[0, 3], [2, 2]])
        >>> x
        array([[0, 3],
               [2, 2]])
    '''

    classCount = {}
    # classCount 是字典

    for i in range(k):
        m = sortedDistIndicies[i]
        # 當i=0時，sortedDistIndicies[0] = 2

        voteIlabel = labels[m]
        # voteIlabel = B

        classCount[voteIlabel] = classCount.get(voteIlabel,0) + 1
        # dict.get(key, default=None)
        # key -- 字典中要查詢的鍵。
        # default -- 如果指定鍵的值不存在時，返回該預設值值
        # 返回指定鍵的值，如果值不在字典中返回預設值None

    # 迴圈結束後的結果為：
    # classCount = {'A': 1, 'B': 2}

    sortedClassCount = sorted(classCount.iteritems(), key=operator.itemgetter(1), reverse= True)
    # itemgetter(1)方法按照第二個元素的次序對元組進行排序，
    # reverse表示逆序，結果為：[('B', 2), ('A', 1)]

    return sortedClassCount[0][0]

if __name__ == '__main__':
    group, labels = createDataSet()
    print classify0([0, 0], group, labels, 3)

輸出的結果是： B

KNN（K鄰近）演算法

k-鄰近演算法的一般流程收集資料：可以使用任何方法準備資料：距離計算（應該是計算距離）所需要的數值，最好是結構化的資料格式分析資料：可以使用任何方法訓練演算法：此步驟不適用與k-鄰近演算法測試演算法：計算錯誤率使用演算法：首先需要輸入樣本資料和

常見機器學習演算法學習——KNN（K鄰近）

1、演算法簡述文章中描述性內容，多來自維基百科KNN。 KNN（ k-nearest neighbors algorithm）是一種非引數、有監督演算法，由T. M. COVER, P. E. HART, Hart PE

【python與機器學習入門1】KNN（k近鄰）演算法2 手寫識別系統

參考部落格：超詳細的機器學習python入門knn乾貨（po主Jack-Cui 參考書籍：《機器學習實戰》——第二章 KNN入門第二彈——手寫識別系統demo ——《機器學習實戰》第二章2.3 手寫識別系統 &

淺談knn（k近鄰）演算法

概述 K近鄰演算法是一種懶惰演算法，即沒有對資料集進行訓練的過程，其模型的三個要素：距離度量、k值的選擇和分類決策規則決定。 K近鄰的思想很簡單，即在一個數據集上，給定一個新樣本，找到與新樣本距離最近的k個例項，在這些例項中屬於多數的類即為這個新樣本的類。

KNN（k近鄰）演算法原理

原理：樣本點的特性與該鄰居點的特性類似，可以簡單理解為“物以類聚”。因此可以使用目標點的多個鄰近點的特性表示當前點的特性。2.KNN演算法包含：1、KNN分類演算法：“投票法”，選擇這k 個樣本中出現最多的類別標記作為預測結果；2、KNN迴歸演算法：“平均法”，將這k 個樣本

步步學習之用python實戰機器學習1－kNN （K-NearestNeighbors）演算法（a）

我最近才開始接觸機器學習，我大學數學學的幾乎忘了，最近才接觸python。所以我以一個完全初學者角度來學習機器學習。我主要用的書籍就是machine learning in action （機器學習實戰）這本書。我主要是用文中已有的程式碼來講解機器學習。同時對程式碼進行

KNN（K近鄰）演算法的簡單入門

機器學習實戰（第二章：k-近鄰演算法）今天學習了第二章，在此就我理解做一下簡單的總結，算是加深我的理解和用我自己的語言描述出這個演算法吧。距離計算基於向量空間的歐幾里得距離的計算。（L2距離）特別情況下可採用Lp距離（明氏距離） L1距離。簡單點來說就是在一

機器學習之KNN（k近鄰）演算法

1、演算法介紹k近鄰演算法是學習機器學習的入門演算法，可實現分類與迴歸，屬於監督學習的一種。演算法的工作原理是：輸入一個訓練資料集，訓練資料集包括特徵空間的點和點的類別，可以是二分類或是多分類。預測時，輸入沒有類別的點，找到k個與該點距離最接近的點，使用多數表決的方法，得出最後的預測分類。

機器學習之KNN（k近鄰）演算法詳解

1-1 機器學習演算法分類一、基本分類： ①監督學習（Supervised learning）資料集中的每個樣本有相應的“正確答案”，根據這些樣本做出預測，分有兩類：迴歸問題和分類問題。步驟1：資料集的建立和分類步

kNN（k鄰近演算法）

kNN（k鄰近演算法）核心思想 kNN 演算法的核心思想是如果一個樣本在特徵空間中的 k 個最相鄰的樣本中的大多數屬於某一個類別，則該樣本也屬於這個類別，並具有這個類別上樣本的特性。 kNN 方法在類別決策時，只與極少量的相鄰樣本有關。由於 kNN 方法主要靠周圍有限的鄰近的樣本，而不是靠判別類域的方

K--最鄰近（K-NN）演算法

程式碼整理： # -*- coding: utf-8 -* import numpy as np import matplotlib.pyplot as plt from collections import Counter def dist(A,B):

一文搞懂k近鄰（k-NN）演算法（一）

分享一下我老師大神的人工智慧教程！零基礎，通俗易懂！http://blog.csdn.net/jiangjunshow 也歡迎大家轉載本篇文章。分享知識，造福人民，實現我們中華民族偉大復興！

機器學習——K-均值聚類（K-means）演算法

本文轉載自：https://www.cnblogs.com/ybjourney/p/4714870.html 一 K-均值聚類（K-means）概述聚類 “類”指的是具有相似性的集合。聚類是指將資料集劃分為若干類，使得類內之間的資料最為相似，各類之間的資料相

聚類之均值聚類（k-means）演算法的python實現

# -*- coding: UTF-8 -*- import numpy import random import codecs import copy import re import matplotlib.pyplot as plt def calcuDistance(vec1, vec2):

機器學習之KNN（k近鄰）算法

target rom val zip 定義 stat 2-0 datasets tro 1、算法介紹k近鄰算法是學習機器學習的入門算法，可實現分類與回歸，屬於監督學習的一種。算法的工作原理是：輸入一個訓練數據集，訓練數據集包括特征空間的點和點的類別，可以是二分類或是多分類

7、KNN（K近鄰）

KNN（K最近鄰演算法） 1、KNN行業應用：比如文字識別，面部識別；預測某人是否喜歡推薦電影（Netflix）；基因模式識別，比如用於檢測某中年疾病；客戶流失預測、欺詐偵測（更適合於稀有事件的分類問題） KNN應用場景：通常最近鄰分類器使用於特徵與目標類之間的關係為比較

tensorflow實現基於KNN（和CNN）演算法的阿拉伯數字識別（程式碼詳解）

廢話不多說，直接上專案；（大家如果感興趣可以加深度學習程式碼實現群：225215316，或者畢業想做此方向的加畢設討論群：457756921）首先我們先將具體的數字圖片轉換為向量矩陣形式，儲存在txt檔案下，具體格式如下，其是數字0的矩陣向量形式：整個專案資料

Python 實現 KNN（K-近鄰）算法

動作 bsp operator sort 關於 png 如果 std labels 一、概述　　KNN（K-最近鄰）算法是相對比較簡單的機器學習算法之一，它主要用於對事物進行分類。用比較官方的話來說就是：給定一個訓練數據集，對新的輸入實例，在訓練數據集中找到與該實

KNN（K最鄰近）演算法

kNN演算法簡介： kNN(k Nearest Neighbors)演算法又叫k最臨近方法，總體來說kNN演算法是相對比較容易理解的演算法之一，假設每一個類包含多個樣本資料，而且每個資料都有一個唯一的類標記表示這些樣本是屬於哪一個分類， kNN就是計算每個樣本資料到待分類資料的距離，取和待分類資料最近的

我的人工智慧之旅——近鄰演算法KNN（K-Nearest Neighbor）

在影象識別中，影象分類是首要工作。因為需要將不同型別的影象先進行排除。近鄰演算法是最簡單的演算法之一，但由於其弊端的存在，本篇只做瞭解性的簡單介紹， K近鄰演算法的實質將測試圖片在已經分類好的，具有不同標籤的訓練資料圖片中，找到K張最相似的圖片，進而根據K張圖片中型別的比例大小，推斷圖

KNN（K鄰近）演算法

相關推薦