sklearn學習筆記之Kmeans聚類

阿新 • • 發佈：2019-01-08

先講KMeans的建構函式：

使用前需要匯入

import sklearn.cluster import KMeans

KMeans(n_clusters=8,
     init='k-means++', 
    n_init=10, 
    max_iter=300, 
    tol=0.0001, 
    precompute_distances='auto', 
    verbose=0, 
    random_state=None, 
    copy_x=True, 
    n_jobs=1, 
    algorithm='auto'
    )

各個引數的意義：

引數的意義：

n_clusters

:簇的個數，即你想聚成幾類
init: 初始簇中心的獲取方法
n_init: 獲取初始簇中心的更迭次數
max_iter: 最大迭代次數（因為kmeans演算法的實現需要迭代）
tol: 容忍度，即kmeans執行準則收斂的條件
precompute_distances：是否需要提前計算距離
verbose: 冗長模式（不太懂是啥意思，反正一般不去改預設值）
random_state: 隨機生成簇中心的狀態條件。
copy_x: 對是否修改資料的一個標記，如果True，即複製了就不會修改資料。
n_jobs: 並行設定
algorithm: kmeans的實現演算法，有：'auto', 'full', 'elkan'

, 其中 'full'表示用EM方式實現

雖然引數眾多，但大多有預設值，下面給出運用例項：

import osimport scipy as sp
import numpy as np
from scipy.stats import norm
from matplotlib import pylab
from sklearn.cluster import KMeans

xw1 = norm(loc=0.3, scale=.15).rvs(20)
yw1 = norm(loc=0.3, scale=.15).rvs(20)

xw2 = norm(loc=0.7, scale=.15).rvs(20)
yw2 = norm(loc=0.7, scale=.15).rvs(20)

xw3 = norm(loc=0.2, scale=.15).rvs(20)
yw3 = norm(loc=0.8, scale=.15).rvs(20)


x = sp.append(sp.append(xw1, xw2), xw3)
y = sp.append(sp.append(yw1, yw2), yw3)

km = KMeans(init='random', n_clusters=3, verbose=1,
            n_init=1, max_iter=6)
colors=['red','green','blue']
marker=['o','p','^']
for i in km.labels_:
    pylab.scatter(x[km.labels_==i],y[km.labels_==i],marker=marker[i],c=colors[i])
pylab.show()

關於KMeans物件的屬性：

labels_:每個點的分類；

cluster_centers_：向量，[n_clusters, n_features]

inertia_：float，每個點到其簇的質心的距離之和。

KMeans物件的方法：

fit(X[,y])：計算k-means聚類。

fi_predictt(X[,y])：計算簇質心並給每個樣本預測類別。

fit_transform(X[,y])：計算簇並 transform X to cluster-distance space。

get_params([deep])：取得估計器的引數。

predict(X)：給每個樣本估計最接近的簇。

score(X[,y])：Opposite of the value of X on the K-means objective (?)

set_params(**params)：為這個估計器手動設定引數。

transform(X[,y])：將X轉換入cluster-distance 空間。

sklearn學習筆記之Kmeans聚類

先講KMeans的建構函式：使用前需要匯入 import sklearn.cluster import KMeansKMeans(n_clusters=8, init='k-means++', n_init=10, max_iter=300,

OpenCV學習筆記(1):Kmeans聚類

前言一提到聚類演算法，必然首先會想到的是kmeans聚類，因為它的名氣實在太大了。最近，剛好要使用OpenCV中Kmeans函式。這節內容主要是講講OpenCV中kmeans函式的使用方法。　開發環境：OpenCV2.4.8+VS2013 實驗

機器學習之kMeans聚類

機器學習之kMeans聚類 # -*- coding: utf-8 -*- """ Created on Wed Nov 28 16:23:36 2018 @author: muli """ from sklearn.datasets.samples_generat

機器學習之--kmeans聚類簡單算法實例

rpo src datasets += atp 中心 ets att erp import numpy as np import sklearn.datasets #加載原數據 import matplotlib.pyplot as plt

sklearn學習筆記之簡單線性回歸

學習實現數據 list 標準 code 線性模型它的擴展簡單線性回歸線性回歸是數據挖掘中的基礎算法之一，從某種意義上來說，在學習函數的時候已經開始接觸線性回歸了，只不過那時候並沒有涉及到誤差項。線性回歸的思想其實就是解一組方程，得到回歸函數，不過在出現誤差項之

Python機器學習(1)：KMeans聚類

ima mea arr src ont array imp rom open Python進行KMeans聚類是比較簡單的，首先需要import numpy，從sklearn.cluster中import KMeans模塊： import numpy as np f

sklearn學習筆記之開始

self. prefix strong uri num except 頗受 user 進行簡介 ??自2007年發布以來，scikit-learn已經成為Python重要的機器學習庫了。scikit-learn簡稱sklearn，支持包括分類、回歸、降維和聚類四大機器學習

java學習筆記之DBUtils工具類

return on() 變參 ner where 占位符使用步驟 args user DBUtils工具類一.介紹　　DBUtils是Apache組織開源的數據庫工具類。二.使用步驟　　①.創建QueryRunner對象　　②.調用update()方法或者que

慕課網JavaScript深入淺出學習筆記之數據類型

bool ins 等於對象的比較 defined 轉換 arr ply 理解 JavaScript數據類型六種數據類型(五種原始類型，一種對象類型) number sttring boolean null undefined object #對象 Function

吳恩達老師機器學習筆記K-means聚類演算法（二）

運用K-means聚類演算法進行影象壓縮趁熱打鐵，修改之前的演算法來做第二個練習—影象壓縮原始圖片如下：程式碼如下： X =imread('bird.png'); % 讀取圖片 X =im2double(X); % unit8轉成double型別 [m,n,z]=size

吳恩達老師機器學習筆記K-means聚類演算法（一）

今天接著學習聚類演算法以後堅決要八點之前起床學習！不要浪費每一個早晨。 K-means聚類演算法聚類過程如下：原理基本就是先從樣本中隨機選擇聚類中心，計算樣本到聚類中心的距離，選擇樣本最近的中心作為該樣本的類別。最後某一類樣本的座標平均值作為新聚類中心的座標，如此往復。原

Andrew Ng 機器學習筆記 12 ：聚類

K均值 (K-means)演算法 K-Means的規範化描述異常情況 K均值的代價函式隨機初始化肘部法則 (Elbow Method)

【機器學習筆記12】聚類（k-means)

K-means 演算法演算法流程如下：（1）在樣本中選擇兩個點（也可以是若干個）作為種子點；（2）計算其餘各個樣本離該種子點的距離，並將其分為兩類；（3）將種子點移到（2）所分為的兩類的中間；（4）重複（2）(3)直到種子不再移動； K-means

【機器學習筆記13】聚類（高斯混合聚類）

【參考資料】【1】《統計學習方法》【2】《概率論與數理統計》【3】小象學院 EM演算法高斯分佈定義: 如果隨機變數X的概率密度為f(x)=12πσe−(x−u)22σ2f(x)= \dfrac{1}{\sqrt{2\pi}\sigma}e^{-\df

sklearn學習筆記之svm

支援向量機: # -*- coding: utf-8 -*- import sklearn from sklearn.svm import SVC import matplotlib.pyplot as plt from sklearn.model_selection import tra

sklearn學習筆記之神經網路

# -*- coding: utf-8 -*- import sklearn from sklearn.neural_network import MLPClassifier import matplotlib.pyplot as plt from sklearn.model_selectio

sklearn學習筆記之knn分類演算法

# -*- coding: utf-8 -*- import sklearn from sklearn import neighbors import matplotlib.pyplot as plt from sklearn.model_selection import train_test_

sklearn學習筆記之決策樹分類和線性迴歸

decisoin tree： # -*- coding: utf-8 -*- import sklearn from sklearn import tree import matplotlib.pyplot as plt from sklearn.model_selection impor

sklearn學習筆記之簡單線性迴歸

簡單線性迴歸線性迴歸是資料探勘中的基礎演算法之一，從某種意義上來說，在學習函式的時候已經開始接觸線性迴歸了，只不過那時候並沒有涉及到誤差項。線性迴歸的思想其實就是解一組方程，得到迴歸函式，不過在出現誤差項之後，方程的解法就存在了改變，一般使用最小二乘法進行計算。使用sklearn.linear_model

CSS3學習筆記之目標偽類選擇器

目標偽類選擇器用來匹配文件（頁面）的URI中某個識別符號的目標元素。URI中的識別符號通常會包含一個丼號，後面帶有一個識別符號名稱，例如#contact:target就是用來匹配ID為contact的元素被URI選中時候的樣式的，:target偽類選擇器選取連結的目標元

sklearn學習筆記之Kmeans聚類

相關推薦