sklearn k最鄰近演算法

阿新 • • 發佈：2018-12-20

1、介紹

k最鄰近演算法可以說是一個非常經典而且原理十分容易理解的演算法，可以應用於分類和聚合。

優點：

1、簡單，易於理解，易於實現，無需估計引數，無需訓練；

2、適合對稀有事件進行分類；

3、特別適合於多分類問題(multi-modal,物件具有多個類別標籤)， kNN比SVM的表現要好；

缺點：

1、對規模超大的資料集擬合時間較長，對高維資料擬合欠佳，對稀疏資料集束手無策

2、當樣本不平衡時，如一個類的樣本容量很大，而其他類樣本容量很小時，有可能導致當輸入一個新樣本時，該類樣本並不接近目標樣本

2、程式碼實際應用

分類

from sklearn.datasets import make_blobs
from sklearn.neighbors import KNeighborsClassifier
from sklearn.model_selection import train_test_split
import matplotlib.pyplot as plt
from matplotlib.colors import ListedColormap
import numpy as np

X, y = make_blobs(n_samples=500, centers=5, random_state=8)

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, stratify=y)
markers = ('s', 'x', 'o', '^', 'v')
colors = ('red', 'blue', 'lightgreen', 'gray', 'cyan')
cmap = ListedColormap(colors[:len(np.unique(y_train))])

clf = KNeighborsClassifier()
clf.fit(X_train, y_train)

X_min, X_max = X_train[:, 0].min() - 1, X_train[:, 0].max() + 1
y_min, y_max = X_train[:, 1].min() - 1, X_train[:, 1].max() + 1

xx, yy = np.meshgrid(np.arange(X_min, X_max, .02), np.arange(y_min, y_max, .02))
Z = clf.predict(np.c_[xx.ravel(), yy.ravel()])
Z = Z.reshape(xx.shape)

plt.pcolormesh(xx, yy, Z, cmap=plt.cm.spring)

plt.scatter(X_train[:, 0], X_train[:, 1], c=y_train, cmap=cmap)
# for idx, cl in enumerate(np.unique(y_train)):
#     plt.scatter(X_train[:, 0], X_train[:, 1], c=y_train, cmap=cmap)
    # plt.scatter(X_train[:, 0], X_train[:, 1], c=y_train, cmap=cmap, edgecolors='y', marker=markers[idx], alpha=0.8, linewidths=1)

print("模型的正確率：{:.2f}".format(clf.score(X_test, y_test)) )
plt.xlim(xx.min(), xx.max())
plt.ylim(yy.min(), yy.max())
plt.title("Classifier:KNN")
plt.show()

迴歸

from sklearn.datasets import make_regression
from sklearn.neighbors import KNeighborsRegressor

import matplotlib.pyplot as plt
import numpy as np

# 生成隨機迴歸資料
X, y = make_regression(n_features=1, n_informative=1, noise=50, random_state=8)

reg = KNeighborsRegressor(n_neighbors=2)
reg.fit(X, y)
# 隨機產生x的預測值，根據訓練模型來預測y的值
z = np.linspace(-3, 3, 200).reshape(-1, 1)
plt.scatter(X, y, c='orange', edgecolors='k')

plt.plot(z, reg.predict(z), c='k', linewidth=3)
print("模型評分：{:.2f}".format(reg.score(X, y)))
plt.title('KNN Regressor')
plt.show()

分類實際應用：將酒分類

from sklearn.datasets import load_wine
from sklearn.model_selection import train_test_split
from sklearn.neighbors import KNeighborsClassifier
import numpy as np

wine_dataset = load_wine()

print(wine_dataset['data'].shape)
X_train, X_test, y_train, y_test = train_test_split(wine_dataset['data'], wine_dataset['target'], random_state=0)

print(X_train.shape)
print(X_test.shape)
print(y_train.shape)
print(y_test.shape)

clf = KNeighborsClassifier(n_neighbors=7)
clf.fit(X_train, y_train)

print("測試資料集得分: {:.2f}".format(clf.score(X_test, y_test)))

X_new = np.array([[13.2, 2.77, 2.51, 18.5, 96.6, 1.04, 2.55, 0.57, 1.47, 6.2, 1.05, 3.33, 820]])

prediction = clf.predict(X_new)
print("預測新紅酒的分類為：{}".format(wine_dataset['target_names'][prediction]))

sklearn k最鄰近演算法

1、介紹 k最鄰近演算法可以說是一個非常經典而且原理十分容易理解的演算法，可以應用於分類和聚合。優點： 1、簡單，易於理解，易於實現，無需估計引數，無需訓練； 2、適合對稀有事件進行分類； 3、特別適合於多分

k最鄰近演算法——加權kNN

加權kNN 　　上篇文章中提到為每個點的距離增加一個權重，使得距離近的點可以得到更大的權重，在此描述如何加權。反函式　　該方法最簡單的形式是返回距離的倒數，比如距離d，權重1/d。有時候，完全一樣或非常接近的商品權重會很大甚至無窮大。基於這樣的原因，在距離求倒數時，在距

k最鄰近演算法-KNN，及python3 例項程式碼

剛讀了《machine learning in action》的KNN演算法。 K最近鄰演算法（kNN，k-NearestNeighbo），即計算到每個樣本的距離，選取前k個。從前k個選擇出大多數屬於的class來進行分類，以下特點： 1. 簡單，無需訓練 2. 樣本數量不

Note cs231n影象分類K最鄰近演算法

注：所有筆記內容均來自cs231n學習視訊,部分英文是因為中文翻譯太繞口最簡單的分類器：Nearest Neighbor（最臨近演算法）訓練階段：記住所有的訓練資料和標籤（什麼也不做）預測階段：take new image and go to try to find the

K--最鄰近（K-NN）演算法

程式碼整理： # -*- coding: utf-8 -* import numpy as np import matplotlib.pyplot as plt from collections import Counter def dist(A,B):

KNN（K最鄰近）演算法

kNN演算法簡介： kNN(k Nearest Neighbors)演算法又叫k最臨近方法，總體來說kNN演算法是相對比較容易理解的演算法之一，假設每一個類包含多個樣本資料，而且每個資料都有一個唯一的類標記表示這些樣本是屬於哪一個分類， kNN就是計算每個樣本資料到待分類資料的距離，取和待分類資料最近的

K最近鄰演算法（KNN）---sklearn+python實現

def main(): import numpy as np from sklearn import datasets digits=datasets.load_digits() x=digits.data y=digits.target from sklear

K一最鄰近演算法在文字自動分類中的應用

一種常用的基於內容的分類演算法-----k--最鄰近演算法（KNN），利用KNN演算法並且結合結合改進的詞特徵權值計算方法和文字相似度的計算方法完成了文字的自動分類．通過KNN方法分類之後的結果的查準率、查全率得以明顯提高．傳統的分類方法

分類：K最鄰近分類

最鄰近分類是分類方法中比較簡單的一種，下面對其進行介紹 1.任務分類 2.結構 &nbs

機器學習筆記——最鄰近演算法（KNN）補充

最鄰近演算法補充(K-Nearest Neighbor,KNN) 1、訓練資料集？測試資料集？我們在使用機器學習演算法訓練好模型以後，是否直接投入真實環境中使用呢？其實並不是這樣的，在訓練好模型後我們往往需要對我們所建立的模型做一個評估來判斷當前機器學習演算法的效能，當我們在

神經網路初學者-k最鄰近

今天，我們來了解一下k-最鄰近分類器這是原文地址http://cs231n.github.io/classification/ 現在，讓我們開始吧首先，k-最鄰近分類器與卷積神經網路一點關係都沒有，但是它會給我們一個直觀感受，分類器是如何工作的。以下是我

K最近鄰演算法（K-NN）

K-NN是什麼？ K最近鄰演算法是一種簡單但目前最常用的分類演算法，也可用於迴歸。 KNN沒有引數（不對資料潛在分佈規律做任何假設），基於例項（不建立明確的模型，而是通過具體的訓練例項進行預測），用於監督學習中。 K-NN演算法怎麼工作？當用KNN進行分類時，

圖說十大資料探勘演算法(一)K最近鄰演算法

用官方的話來說，所謂K近鄰演算法，即是給定一個訓練資料集，對新的輸入例項，在訓練資料集中找到與該例項最鄰近的K個例項（也就是上面所說的K個鄰居），這K個例項的多數屬於某個類，就把該輸入例項分類到這個類中。如果你之前沒有學習過K最近鄰演算法，那今天幾張圖，讓你明白什麼是K最近鄰

python -- K最近鄰演算法

KNN核心演算法函式 #! /usr/bin/env python3 # -*- coding: utf-8 -*- # fileName ： KNNdistance.py # author : [email protected] import

KNN K最近鄰演算法

　　K Nearest Neighbor,KNN,K最近鄰演算法。　　演算法原理：　　　　(1)計算未知類別資料點與已知類別資

機器學習-簡單的K最近鄰演算法及python實現

根據前人的成果進行了學習 https://www.cnblogs.com/ahu-lichang/p/7161613.html#commentform 1、演算法介紹其實k最近鄰演算法算是聚類演算法中最淺顯易懂的一種了，考慮你有一堆二維資料，你想很簡單的把它分開，像下圖這

機器學習（4）K最近鄰演算法

定義：根據最近的樣本決定測試樣本的類別。為了判斷未知例項的類別，以所有已知類別的例項作為參照選擇引數K 計算未知例項與所有已知例項的距離選擇最近K個已知例項根據少數服從多數的投票法則(majority-voting)，讓未知例項歸類為K個

K最近鄰演算法

設想你想了解一個陌生人的飲食風格，如果你對他所知無幾，那麼最容易想到的一個捷徑就是看看他生存的周圍人群的口味。但是如果你對他的資訊知道更多，例如知道他的年齡、收入等，那麼這個時候就最好從他周圍的人群中去挑選與他年齡、收入相近的人的飲食風格，這樣預測會更準確一點。這其中蘊含的

圖解演算法第10章 k最近鄰演算法

本章內容 k鄰近演算法建立分類系統學習特徵抽取學習迴歸學習k最近鄰居演算法的應用和侷限性 k最近鄰居 k-nearest neighbours KNN 特徵抽取座標軸中兩個點的距離：勾股定理 OCR圖書數字化提取線段，點，曲線等特徵。

python機器學習庫sklearn——K最近鄰、K最近鄰分類、K最近鄰迴歸

這裡只講述sklearn中如何使用KNN演算法。無監督最近鄰 NearestNeighbors （最近鄰）實現了 unsupervised nearest neighbors learning（無監督的最近鄰學習）。它為三種不同的最近鄰演算法

sklearn k最鄰近演算法

1、介紹

2、程式碼實際應用

相關推薦