K-近鄰演算法的一個簡單例子（二）

阿新 • • 發佈：2019-01-02

接著上一個例子進行拓展，file2matrix（）函式將文件中的資料轉化為記憶體中的矩陣（陣列），autoNorm（）將三列資料歸一化，這裡要注意這裡使用的歸一化方法對於極值點非常敏感，可以考慮其他的方法。datingClassTest()呼叫KNN中的classify0函式對資料集進行逐個進行
分類，這裡K取3.hoRatio=0.10劃定了訓練集和檢驗集，但要想實現更好的效果，對於劃定訓練集和檢驗集需要十分慎重，使用隨機抽取等方法
from  numpy import  *
import  matplotlib.pyplot as pyt
import KNN
def file2matrix(filename):
    fr=open(filename)
    arrayOLines=fr.readlines()                                #注意和read()、readline()的區別
    numberOfLines=len(arrayOLines)
    returnMat=zeros((numberOfLines,3))
    classLabelVector=[]
    index=0
    for line in arrayOLines:
        line=line.strip()
        listFromLine=line.split('\t')
        returnMat[index,:]=listFromLine[0:3]                  #這裡 returnMat[index,:]，意思是指index行進行[:]
        classLabelVector.append(listFromLine[-1])
        index+=1
    return returnMat,classLabelVector
def autoNorm(dataSet):
    minVals=dataSet.min(0)                                    #numpy中min()沒有引數時，返回所有中最小的，0每列最小，1每行最小
    maxVals=dataSet.max(0)
    ranges=maxVals-minVals
    normDataset=zeros(shape(dataSet))
    m=dataSet.shape[0]                                        #dataSet的行數
    normDataset=dataSet-tile(minVals,(m,1))
    # jk=tile(range,(m,1))
    normDataset=normDataset/tile(ranges,(m,1))
    return normDataset
def datingClassTest():
    hoRatio=0.10                                              #測試資料所佔的比例
    datingDataMat,datingDataLabel=file2matrix('E:\datingTestSet.txt')
    normMat=autoNorm(datingDataMat)
    m=normMat.shape[0]
    numTestVecs=int(m*hoRatio)
    erroCount=0.0
    for i in range(numTestVecs):
        classifierResult=KNN.classify0(normMat[i,:],normMat[numTestVecs:m,:],datingDataLabel[numTestVecs:m],3)
        print('the classifier came back with: %s,the real answer is : %s '%(classifierResult,datingDataLabel[i]))
        if (classifierResult!=datingDataLabel[i]): erroCount+=1.0
    print('the total error rate is : %f'%(erroCount/float(numTestVecs)))
datingClassTest()

執行結果：

the classifier came back with: 1,the real answer is : 1

..............此處省略998行

the classifier came back with: 2,the real answer is : 2
the total error rate is : 0.080000

錯誤率8%，還不錯

K-近鄰演算法的一個簡單例子（二）

接著上一個例子進行拓展，file2matrix（）函式將文件中的資料轉化為記憶體中的矩陣（陣列），autoNorm（）將三列資料歸一化，這裡要注意這裡使用的歸一化方法對於極值點非常敏感，可以考慮其他的方法。datingClassTest()呼叫KNN中的classify0函式

K近鄰演算法理解及實現（python）

KNN的工作原理：給定一個已知標籤類別的訓練資料集，輸入沒有標籤的新資料後，在訓練資料集中找到與新資料最鄰近的k個例項，如果這k個例項的多數屬於某個類別，那麼新資料就屬於這個類別。可以簡單理解為：由那些離X最近的k個點來投票決定X歸為哪一類。在二維平面下：

K-近鄰演算法的Python實現（一）

1.Python的語言環境和參考的書籍下面給出的程式碼是基於Python2.7.9編寫的（編譯器推薦使用pycharm），Python到了3.0以後的版本語言有所改變，但是大體上沒有太大的變化。我所給出的程式碼是引用《機器學習實戰》中的程式碼，帶

VS2015+QT5簡單例子（二）——讀取視訊

1.新建一個QT專案QT_VS_Capture.sln（Qt Application） 2.設定標頭檔案路徑專案-屬性-VC++目錄 (1)設定包含目錄QT5.6\5.6\msvc2015_64\include (2)設定庫目錄QT5.6\5.6\msvc2015_64\

一個簡單的MyBatis完成插入操作的例子（二）

配置好mybatis-config.xml檔案後，我們在com.sk.pojo下建立一個pojo類，類名為Student Student類需要與資料庫中的欄位一一對映 public student(){ private Integer id;

從零開始Rtklib解讀篇-簡單的程式設計理論和演算法及結構分析（二）

從bin裡進入。主進入方式為RTKLAUNCH.exe 第一個RTKPLOT右上角的小方塊可以勾選NormalAPs，RTKPOST_MKL，RTKPOST_WIN64, Minimize等選項。通常是第一個。另外64位系統下通常也是選用NormalAPs，RTKPOST_WIN

設計模式簡單小例子（二）結構型模式

簡單小例子原始碼已經上傳到了GitHub. https://github.com/tanglonghui/DesignPatterns 設計模式簡單小例子（一）建立型模式： https://blog.csdn.net/qq_40687864/article/details/810

統計學習方法 k 近鄰演算法(附簡單模型程式碼)

1. k 近鄰演算法 k近鄰法（k-nearest neighbor， k-NN）是一種基本分類與迴歸方法。 k近鄰法的輸入為例項的特徵向量，對應於特徵空間的點；輸出為例項的類別，可以取多類。 k近鄰法假設給定一個訓練資料集，其中的例項類別已定。分類時，對新的例項，根

Ext簡單的一個RowEditor例子（C#）

先上圖，一個很簡單的RowEditor的實現，如下圖所示：此實現，是根據ext-3.2.0/ux/RowEditor.js實現的，具體程式碼如下：頁面引用東西如下： <link rel="stylesheet" type="text/css" hr

演算法課堂實驗報告（二）——python遞迴和分治（第k小的數，大數乘法問題）

python實現遞迴和分治一、開發環境開發工具：jupyter notebook 並使用vscode，cmd命令列工具協助程式設計測試演算法,並使用codeblocks輔助編寫C++程式程式語言：python3.6 二、實驗目標 1. 熟悉遞迴和分治演算法實現的

vue-router單頁應用簡單示例（二）

數據 prop tps div -1 可重用性 example 定位 .com 我們先來理一下思路。圖1:main.js 引入vue,App.vue,router/index.js文件聲明要渲染的Id為app，將App.vue中的模版渲染到入口界面（就

Python開發簡單爬蟲（二）---爬取百度百科頁面數據

class 實例實例代碼編碼 mat 分享 aik logs title 一、開發爬蟲的步驟 1.確定目標抓取策略：打開目標頁面，通過右鍵審查元素確定網頁的url格式、數據格式、和網頁編碼形式。 ①先看url的格式, F12觀察一下鏈接的形式;② 再看目標文本信息的

前端自動化工具 grunt 插件的簡單使用（二）

前端自動化工具 grunt 插件的簡單使用（二）一、contrib-concat 插件的使用1、安裝 “grunt-contrib-concat ”插件命令（在終端進入到項目根目錄執行） npm install grunt-contrib-concat --save-dev2、在項目根目

【4】簡單繪圖（二）

dispose alt draw bsp rom 形狀 .html yellow tex 在上一篇裏已經向大家介紹了如何使用GDI+繪制簡單的圖像,這一篇繼續向大家介紹其它一些繪圖知識. 1.首先我們來看下上一篇中我們使用過的Pen. Pen的屬性主要有: Color(顏色

sizeof操作符例子（二）

全局變量 tid can images 是否 eof () img 數組和指針 1.假設每班人數最多不超過30人，具體人數由鍵盤輸入，試編程打印最高分及其學號。要求：用一維數組和指針變量作函數參數，編程打印某班一門課成績的最高分和學號 #include <stdi

javascript 對象簡單介紹（二）

則表達式數字 orange red 1.4 dom 空白字符手冊 document JavaScript Array（數組）對象數組對象的作用是：使用單獨的變量名來存儲一系列的值。什麽是數組?數組對象是使用單獨的變量名來存儲一系列的值。如果你有一組數據（例如：車名字

路由器簡單配置-（二）

nvram 加載 enca 自動 rabl mic 都是 start 手動電腦中arp -a查看arp表電腦中arp -s IPadd MAC進行arp綁定電腦中arp -d清除arp緩存路由器arp -a查看arp表路由器arp IPadd MAC進行arp綁定

PHP CI 框架簡單使用（二）

mes base per undefine color message defined 保持 def 　　我們簡單認識一下CI框架的MVC。示例代碼如下 //CI控制器文件Home.php <?php defined(‘BASEPATH‘) OR exit(‘N

Java常用的八種排序演算法與程式碼實現（二）：歸併排序法、快速排序法

注：這裡給出的程式碼方案都是通過遞迴完成的－－－歸併排序（Merge Sort）：　　分而治之，遞迴實現　　如果需要排序一個數組，我們先把陣列從中間分成前後兩部分，然後對前後兩部分進行分別排序，再將排好序的數組合並在一起，這樣整個陣列就有序了　　歸併排序是穩定的排序演算法，時間

JDK中JCA的簡單使用（二）---RSA加簽驗籤

Signature 類 Signature類是一個引擎類，提供加密的數字簽名演算法，例如DSA或RSAwithMD5。加密安全簽名演算法採用任意大小的輸入和私鑰，並生成一個相對較短（通常是固定大小）的位元組串——簽名。只有私鑰/公鑰對的所有者才能建立簽名。對於擁有公鑰的任何人來說

K-近鄰演算法的一個簡單例子（二）

相關推薦