基於KNN分類演算法手寫數字識別的實現（二）——構建KD樹

阿新 • • 發佈：2018-12-12

上一篇已經簡單粗暴的建立了一個KNN模型對手寫圖片進行了識別，所以本篇文章採用構造KD樹的方法實現手寫數字的識別。

（一）構造KD樹

構造KD樹的基本原理網上都有介紹，所以廢話不多說，直接上程式碼。

#Knn KD_Tree演算法

import math
from collections import namedtuple

#定義命名元祖，用來存放結果，最近點，最近距離和訪問過的節點數
result = namedtuple('Result_tuple', 'nearest_point nearest_dist nodes_visited')


# In[5]:


#構造KD樹

#初始化構造KD樹的元素
class KD_Node(object):
    
    def __init__(self, dom_elt, split, left, right):
        
        self.dom_elt = dom_elt #k維向量節點
        self.split = split     #整數，進行分割的序號
        self.left = left       #該節點分割超平面的左子樹
        self.right = right     #該節點分割超平面的右子樹
        
class KD_Tree(object):
    
    def __init__(self, data):
        
        k = len(data[0])       #資料的維度
        
        def Create_Node(split, data_set): #按第split維劃分資料data_set建立的KD_Node
            
            if (data_set == []):       #資料集為空

                return None
            #key引數的值為一個函式，此函式只有一個引數且返回一個值來進行比較
            #operator模組提供的itemgetter函式用來獲取物件有哪些維的資料，
            #引數為需要獲取的資料物件中的序號
            data_set = list(data_set)
            data_set.sort(key=lambda x: x[split])
            split_positon = len(data_set) // 2 #//代表整除
            median = data_set[split_positon] #中位數
            split_next = (split + 1) % k 
            #遞迴建立KD數
            return KD_Node(median, split,
                          Create_Node(split_next, data_set[:split_positon]),
                          Create_Node(split_next, data_set[split_positon + 1:]))
        
        self.root = Create_Node(0, data)
        
#KD樹的前序遍歷
def Pre_Order(root):
    
#     print(root.dom_elt)
    if (root.left):
        Pre_Order(root.left)
    if (root.right):
        Pre_Order(root.right)

KD樹構造完成後，可以計算最近鄰。

#搜尋最近鄰

def Find_Nearest(tree, point):
    
    k = len(point) #資料維度
    
    def Travel(kd_node, target, max_dist):
        
        if kd_node is None:
            
            return result([0] * k, float("inf"), 0)#inf表示正無窮，-inf表示負無窮
        
        nodes_visited = 1
        s = kd_node.split  #進行分割的維度
        pivot = kd_node.dom_elt #進行分割的軸
        
        if target[s] <= pivot[s]: #如果目標點第s維小於分割軸對應值，即目標離左子樹更近
            
            nearer_node = kd_node.left #下一個訪問的點為左子樹
            further_node = kd_node.right #同時記錄右子樹
        else:                     #目標離右子樹較近的時候
            
            nearer_node = kd_node.right #下一個訪問點為右子樹根節點
            further_node = kd_node.left #記錄左子樹
        
        temp1 = Travel(nearer_node, target, max_dist) #遍歷找到包含目標點的位置
        nearest = temp1.nearest_point #以此節點作為“當前最近點”
        dist = temp1.nearest_dist     #更新最近距離
        nodes_visited += temp1.nodes_visited
        
        if dist < max_dist:
            
            max_dist = dist #最近點將在以目標點為圓心，max_dist為半徑的超球體內
        
        temp_dist = abs(pivot[s] - target[s]) #第s維上目標點與分割超平面的距離
        
        if max_dist < temp_dist: #判斷超球體是否與分割平面相交
            
            return result(nearest, dist, nodes_visited)
            
        #計算目標點與分割點的歐氏距離
        temp_dist = math.sqrt(sum((p1 - p2) ** 2 for p1, p2 in zip(pivot, target)))
        
        if temp_dist < dist: #如果得到更近的點
            
            nearest = pivot  #更新更近的點
            dist = temp_dist #更新最近的距離
            max_dist = dist  #更新超球體半徑
        
        #檢查另一個子節點對應的區域是否有更近的點
        temp2 = Travel(further_node, target, max_dist)
        nodes_visited += temp2.nodes_visited
        
        if temp2.nearest_dist <  dist: #如果另一個子節點中存在更近的距離
            
            nearest = temp2.nearest_point #更新最近的點
            dist = temp2.nearest_dist     #更新最近距離
        
        return result(nearest, dist, nodes_visited)
    
    return Travel(tree.root, point, float("inf")) #從根節點開始遞迴

測試結果，計算[2,4.5]離資料集：[2,3],[5,4],[9,6],[4,7],[8,1],[7,2]中最近的點。

if __name__ == "__main__":
    
    data = [[2,3],[5,4],[9,6],[4,7],[8,1],[7,2]]
    kd = KD_Tree(data)
    rst = Find_Nearest(kd, [2,4.5])

[2,4.5]最近鄰為[2,3]，最短距離為1.5.測試結果看出KD樹的效果還是不錯的。那麼在大資料高維度情況下，KD樹的測試結果怎樣呢。

（二）對比蠻力實現和KD樹實現的區別

對之前處理的1萬條樣本資料選擇8000條作為訓練集，2000條作為檢驗集。

考慮到程式碼行較多的情況，本次對比使用封裝模組，然後呼叫模組執行測試結果。

生成3個.py檔案：Sample.py、Knn.py和KD_Tree.py

此部分程式碼與前面的程式碼區別不大，就不再進行復制。如有需要可以在網頁連結中下載，提取碼： po7s。

執行檔案為Main,py

import sys
sys.path.append(r"D:/Python_work/機器學習/KNN分類演算法/Knn")

from Sample import Sample_PC
from datetime import datetime


#呼叫引數
k = 3
train_file_route = r"E:/data/digit_data_copy/train/"
test_file_route = r"E:/data/digit_data_copy/test/"
model = "KD_Tree"


#執行蠻力實現
func1 = Sample_PC(3,train_file_route, test_file_route,None)
t1 = datetime.now()
result1 = func1.test_data()
t2 = datetime.now()
print('knn耗時：', t2-t1)


#執行KD樹實現
func2 = Sample_PC(3,train_file_route, test_file_route, model=model)
t3 = datetime.now()
result2 = func2.test_data()
t4 = datetime.now()
print('KD_Tree耗時：', t4-t3)

結論：

蠻力實現：準確率：0.977，耗時：2分56秒

混淆矩陣

file_name
forecast_data	0	1	2	3	4	5	6	7	8	9
real_data
0	209	1	0	0	0	0	1	1	0	0
1	0	221	0	0	0	0	0	0	0	0
2	2	0	163	0	1	0	0	2	0	0
3	0	0	0	206	0	1	0	2	1	0
4	0	1	1	0	209	1	1	0	0	2
5	0	1	0	1	0	172	3	0	0	1
6	0	1	0	0	0	0	184	0	0	0
7	0	4	0	0	0	0	0	203	0	0
8	1	1	1	1	0	2	0	1	198	0
9	1	2	0	2	1	0	0	4	0	189

KD樹實現：準確率：0.989，耗時：1個小時53分鐘

混淆矩陣：

雖然，KD樹的準確率在蠻力實現之上，但KD樹對於高維大資料的計算大過於耗費時間，且準確率提升也不是特別高。總體而言，knn分類效果較好，但計算比較耗時，這也是它最大的一個缺點。

基於KNN分類演算法手寫數字識別的實現（二）——構建KD樹

上一篇已經簡單粗暴的建立了一個KNN模型對手寫圖片進行了識別，所以本篇文章採用構造KD樹的方法實現手寫數字的識別。（一）構造KD樹構造KD樹的基本原理網上都有介紹，所以廢話不多說，直接上程式碼。 #Knn KD_Tree演算法 import math from

新手上手Tensorflow之手寫數字識別應用（3）

本系列為應用TensorFlow實現手寫數字識別應用的全過程的程式碼實現及細節討論。按照實現流程，分為如下幾部分： 1. 模型訓練並儲存模型 2. 通過滑鼠輸入數字並儲存 2. 影象預處理 4. 讀入模型對輸入的圖片進行識別本文重點討論影象預處理的問題。所謂的影象預處理，

新手上手Tensorflow之手寫數字識別應用（2）

本系列為應用TensorFlow實現手寫數字識別應用的全過程的程式碼實現及細節討論。按照實現流程，分為如下幾部分： 1. 模型訓練並儲存模型 2. 通過滑鼠輸入數字並儲存 2. 影象預處理 4. 讀入模型對輸入的圖片進行識別本文重點討論模型的儲存以及讀入問題。關於Tens

新手上手Tensorflow之手寫數字識別應用（1）

學深度學習有一段時間了，各種演算法研究一通，什麼CNN啦，RNN啦，LSTM啦，RCNN啦，各種論文看了一堆。看沒看懂且不說（心虛。。），回來我想把訓練的模型看看實際效果的時候，才發現TensorFlow的好多基本功能還不會。好吧，還是拿著Mnist資料集搞一波手寫數字識別的全流程吧！涉

[分享] Python實現的基於深度學習的手寫數字識別演算法

本文將採用深度學習中的卷積神經網路來訓練手寫數字識別模型。使用卷積神經網路建立合理的模型結構，利用卷積層中設定一定數目的卷積核（即濾波器），通過訓練資料使模型學習到能夠反映出十個不同手寫提數字特徵的卷積核權值，最後通過全連線層使用softmax函式給出預測數字圖對應每種數字可能性的概率多少。本文以學習基於

機器學習實戰——KNN演算法手寫數字識別

資料來源我們的文字是形如這樣的，每個數字都有很多txt檔案，TXT裡面是01數字，表示手寫數字的灰度圖。現在我們要用knn演算法實現數字識別。資料處理每個txt檔案都是32*32的0,1矩陣，如果要使用knn，那麼還得考慮行列關係，如果能把它拉開，只有一行，就可以不必考慮數字

機器學習實戰k近鄰演算法(kNN)應用之手寫數字識別程式碼解讀

from numpy import * from os import listdir import operator import time #k-NN簡單實現函式 def classify0(inX,dataSet,labels,k): #求出樣本集的行數，也就是labels標籤的數目

【好玩的計算機視覺】KNN演算法手寫數字識別

OCR應用非常廣泛，而且有許多方法，今天用KNN演算法實現簡單的0-9手寫數字識別。本程式使用OpenCV 3.0和Python 3。 KNN演算法是K近鄰分類演算法，屬於機器學習中的監督學習，需要一定量的帶標籤的輸入樣本資料進行“訓練”，然後就可以識別。我給“訓練”打引

機器學習使用python+OpenCV實現knn演算法手寫數字識別

基本上照搬了http://lib.csdn.net/article/opencv/30167的程式碼，只是改了一點bug和增加了一點功能輸入就是直接在一個512*512大小的白色畫布上畫黑線，然後轉化為01矩陣，用knn演算法找訓練資料中最相近的k個，現在應該是可以對所有字元

Python實現knn演算法手寫數字識別

KNN實現手寫數字識別 1 - 匯入模組 import numpy as np import matplotlib.pyplot as plt from PIL import Image %matplotlib inline 2 - 匯入資

基於tensorflow的MNIST手寫數字識別（二）--入門篇

一、本文的意義因為谷歌官方其實已經寫了MNIST入門和深入兩篇教程了，那我寫這些文章又是為什麼呢，只是抄襲？那倒並不是，更準確的說應該是筆記吧，然後用更通俗的語言來解釋，並且補充

基於感知機的手寫數字識別java實現

多層感知機的手寫數字識別，迭代10次對訓練集的正確率97 Main函式，在繪製完數字後，要點下確定按鈕再去識別，重繪按鈕自然是再次繪圖訓練自己的網路結構會替換之前訓練的網路結構，沒有寫儲存或者另存新網路模型。結果對訓練集變現很好，對繪圖的識別結果仍不

基於tensorflow的MNIST手寫數字識別（三）--神經網路篇

想想還是要說點什麼抱歉啊，第三篇姍姍來遲，確實是因為我懶，而不是忙什麼的，所以這次再加點料，以表示我的歉意。廢話不多說，我就直接開始講了。加入神經網路的意義前面也講到了，使用普通的訓練方法，也可以進行識別，但是識別的精度不夠高，

機器學習框架ML.NET學習筆記【4】多元分類之手寫數字識別

一、問題與解決方案通過多元分類演算法進行手寫數字識別，手寫數字的圖片解析度為8*8的灰度圖片、已經預先進行過處理，讀取了各畫素點的灰度值，並進行了標記。其中第0列是序號（不參與運算）、1-64列是畫素值、65列是結果。我們以64位畫素值為特徵進行多元分類，演算法採用SDCA最大熵分類演算法。

Android+TensorFlow+CNN+MNIST 手寫數字識別實現

SkySeraph 2018 Overview 本文系“SkySeraph AI 實踐到理論系列”第一篇，咱以AI界的HelloWord 經典MNIST資料集為基礎，在Android平臺，基於TensorFlow，實現CNN的手寫數字識別。Code here~ Practice Env

pytorch + visdom AutoEncode 和 VAE(Variational Autoencoder) 處理手寫數字資料集（MNIST）

環境系統：win10 cpu：i7-6700HQ gpu：gtx965m python : 3.6 pytorch ：0.3 資料使用 mnist，使用方法前面文章有。 train_dataset = da

第五章 MNIST數字識別問題（二）

AR dom post mod 變量名 elements 之前 spl with 4.1. ckpt文件保存方法在對模型進行加載時候，需要定義出與原來的計算圖結構完全相同的計算圖，然後才能進行加載，並且不需要對定義出來的計算圖進行初始化操作。這樣保存下來的模型，會在其文

基於java的微信小程式的實現（二）登入，註冊，登出介面的實現

1.開發工具以及相關環境的配置 1.首先關於IDE，前端小程式端採用的是微信官方的微信開發者工具，後端使用的是idea（idea是真的智慧，再也不想回去eclipse了呢），關於前端的一些程式碼，主要是參照微信官方的API進行開發的，整體的檔案結構也和js，css，html也很相似。

基於C#彈幕類射擊遊戲的實現——（二）渲染

這個遊戲打算是用C#+GDI做~所以渲染效率上還是要進行一些考慮的這裡對傳統的GDI+封裝了下，通過批處理來提高一些效率首先給出的是渲染介面的定義，方面以後更換高效能的渲染器（當然很遙遠） /// <summary> /// 渲染器介面 /

機器學習--k-近鄰演算法（kNN）實現手寫數字識別

這裡的手寫數字以0,1的形式儲存在文字檔案中，大小是32x32.目錄trainingDigits有1934個樣本。0-9每個數字大約有200個樣本，命名規則如下：下劃線前的數字代表是樣本0-9的

基於KNN分類演算法手寫數字識別的實現（二）——構建KD樹

相關推薦