scikit-learn幾種常用演算法的比較（code）

阿新 • • 發佈：2018-11-09

from sklearn import datasets
import numpy as np
iris =datasets.load_iris()
X = iris.data[:,[2,3]]
y = iris.target
np.unique(y)        #np.unique(y)返回儲存在iris.target中的各類花朵的類標 

#使用scikit_learn中cross_validation模組中的train_test_split函式，隨機將資料矩陣X與類標向量
#y按照3：7的比例劃分為測試資料集和訓練資料集
from sklearn.cross_validation import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size = 0.3, random_state = 0)

#使用scikit_learn的preprocessing模組中的StandardScaler類對特徵進行標準處理
from sklearn.preprocessing import StandardScaler
sc = StandardScaler()
sc.fit(X_train)      
X_train_std = sc.transform(X_train)
X_test_std = sc.transform(X_test)

#訓練感知器
from sklearn.linear_model import Perceptron
ppn = Perceptron(n_iter = 40, eta0 = 0.1, random_state = 0)
ppn.fit(X_train_std, y_train)

#使用predict方法對測試資料集進行預測
y_pred = ppn.predict(X_test_std)
print('Misclassified Samples:%d' %(y_test != y_pred).sum())


#繪製訓練模型的決策區域
from matplotlib.colors import ListedColormap
import matplotlib.pyplot as plt

#繪製決策區域函式的定義
def plot_decision_regions(X, y, classifier, test_idx = None, resolution =0.01):
    
    #設定顏色表
    markers = ('s', 'x', 'o', '^', '*')
    colors = ('red', 'cyan', 'blue', 'yellow', 'lightred')
    cmap = ListedColormap(colors[:len(np.unique(y))])
    
    #繪製決策區域
    x1_min, x1_max = X[:,0].min()-1, X[:,0].max()+1
    x2_min, x2_max = X[:,1].min()-1, X[:,1].max()+1
    xx1, xx2 = np.meshgrid(np.arange(x1_min, x1_max, resolution),
                           np.arange(x2_min, x2_max, resolution))
    Z = classifier.predict(np.array([xx1.ravel(), xx2.ravel()]).T)
    Z = Z.reshape(xx1.shape)
    plt.contourf(xx1, xx2, Z, alpha = 0.4, cmap = cmap)
    plt.xlim(xx1.min(), xx1.max())
    plt.ylim(xx2.min(), xx2.max())
    
    #繪製所有例項
    X_test, y_test = X[test_idx, :], y[test_idx]
    for idx,c1 in enumerate(np.unique(y)):
        plt.scatter(x = X[y == c1, 0], y =X[y == c1, 1],
        alpha = 0.8, c = cmap(idx),
        marker = markers[idx], label = c1)
        
    #高亮測試例項
    if test_idx:
        X_test, y_test = X[test_idx,:],  y[test_idx]
        plt.scatter(X_test[:,0], X_test[:,1], c = '', 
                    alpha = 1.0, linewidth = 1, marker = 'o',
                    s = 55, label = 'test label')

X_combined_std = np.vstack((X_train_std, X_test_std))
y_combined = np.hstack((y_train, y_test))

#LR
from sklearn.linear_model import LogisticRegression
#樸素貝葉斯：
from sklearn.naive_bayes import GaussianNB
#K-近鄰：
from sklearn.neighbors import KNeighborsClassifier
#決策樹：
from sklearn.tree import DecisionTreeClassifier
#支援向量機：
from sklearn import svm

lr = LogisticRegression(C=1000)
lr.fit(X_train_std, y_train)

gnb = GaussianNB()
gnb.fit(X_train_std, y_train)

knc = KNeighborsClassifier()
knc.fit(X_train_std, y_train)

dt = DecisionTreeClassifier()
dt.fit(X_train_std, y_train)

svmLR = svm.LinearSVR()
svmLR.fit(X_train_std, y_train)

plt.figure()
plot_decision_regions(X = X_combined_std,
                      y = y_combined,
                      classifier = lr, #此處使用分類器ppn或者lr
                      test_idx = range(105, 150))
plt.title('LinearRegression')

plt.figure()
plot_decision_regions(X = X_combined_std,
                      y = y_combined,
                      classifier = gnb, #此處使用分類器ppn或者lr
                      test_idx = range(105, 150))
plt.title('GaussianNB')

plt.figure()
plot_decision_regions(X = X_combined_std,
                      y = y_combined,
                      classifier = knc, #此處使用分類器ppn或者lr
                      test_idx = range(105, 150))
plt.title('KNeighborsClassifier')

plt.figure()
plot_decision_regions(X = X_combined_std,
                      y = y_combined,
                      classifier = dt, #此處使用分類器ppn或者lr
                      test_idx = range(105, 150))
plt.title('DecisionTreeClassifier')

plt.figure()
plot_decision_regions(X = X_combined_std,
                      y = y_combined,
                      classifier = svmLR, #此處使用分類器ppn或者lr
                      test_idx = range(105, 150))
plt.title('svm.LinearSVR')

plt.xlabel("長度")
plt.ylabel("寬度")
plt.legend(loc = 'upper left')
plt.show()

這些程式碼是在python3.6上執行的，時間緊促暫時沒有分析結果，後面修改！

scikit-learn幾種常用演算法的比較（code）

from sklearn import datasets import numpy as np iris =datasets.load_iris() X = iris.data[:,[2,3]] y = iris.target np.unique(y) #np.unique(y)返回儲

Matplotlib中幾種常用的圖形（四）

條形圖條形圖常常用來描述一組資料的對比情況，例如：一週七天，每天的城市車流量等。【條形圖有兩個引數x,y】bar()繪製豎直條形圖、barh()繪製水平條形圖。匯入繪圖工具包： import matplotlib.pyplot as plt imp

計算幾何與圖形學有關的幾種常用演算法（二）

3.6 用向量的叉積判斷直線段是否有交向量叉積計算的另一個常用用途是直線段求交。求交演算法是計算機圖形學的核心演算法，也是體現速度和穩定性的重要標誌，高效並且穩定的求交演算法是任何一個CAD軟體都必需要重點關注的。求交包含兩層概念，一個是判斷是否相

算法系列之九：計算幾何與圖形學有關的幾種常用演算法（二）

3.6 用向量的叉積判斷直線段是否有交向量叉積計算的另一個常用用途是直線段求交。求交演算法是計算機圖形學的核心演算法，也是體現速度和穩定性的重要標誌，高效並且穩定的求交演算法是任何一個CAD軟體都必需要重點關注的。求交包含兩層概念，一個是判斷是否相交，另一個是

計算幾何與圖形學有關的幾種常用演算法（一）

我的專業是計算機輔助設計（CAD），算是一半機械一半軟體，《計算機圖形學》是必修課，也是我最喜歡的課程。熱衷於用程式碼擺平一切的我幾乎將這本教科書上的每種演算法都實現了一遍，這種重複勞動雖然意義不大，但是收穫很多，特別是丟棄了多年的數學又重新回到了腦袋中，算是最大的收

對於單向連結串列的10幾種常用演算法

list.c檔案如下 #include "list.h" /*返回head連結串列POS節點的位置*/ LINK list_moov_pos(LINK head,int pos){ LINK node = head; while(--pos) node = node->pNe

java開發過程中幾種常用演算法

排序演算法排序演算法中包括：簡單排序、高階排序簡單排序簡單排序常用的有：氣泡排序、選擇排序、插入排序氣泡排序程式碼如下： 1 private static void bubbleSrot(int[] arr) { 2 3 for (int

Bean複製的幾種框架效能比較（Apache BeanUtils、PropertyUtils,Spring BeanUtils,Cglib BeanCopier）

進行了三次測試，最後的結果如下： 10次測驗第一次第二次第三次平均值每次平均值 BeanUtil.copyProperties 54 57 50 53.66667 5.366666667 PropertyUtils.copyProperties 4 4 4 4

angularjs2 中幾種常用的型別（String，Number）等

let a:Number=1;//數值型別 let b:String = 'angularjs2';//字元型別 let c:boolean = true; //布林型別 let d:Number [

STL中幾種常用容器比較

list支援快速的插入和刪除，但是查詢費時; vector支援快速的查詢，但是插入費時。 map查詢的時間複雜度是對數的，這幾乎是最快的，hash也是對數的。如果我自己寫，我也會用二叉檢索樹，它在大部分情況下可以保證對數複雜度，最壞情況是常數複雜度，而std::m

幾種常用影像比較

一、Landsat Landsat主題成像儀 (TM)是Landsat4和Landsat5 攜帶的感測器,從1982年發射至今,其工作狀態良好,幾乎實現了連續的獲得地球影像。Landsat4和Landsat5每16 天掃瞄同一地區，即其16天覆蓋全球一次。Landsat4,

php幾種常用演算法

寫一下幾種常見排序演算法，清一下腦子歸併排序 /** * Created by PhpStorm. * User: leon * Date: 2018/3/14 * Time: 下午2:37 */ function mergeSort(&am

計算幾何與圖形學有關的幾種常用演算法

我的專業是計算機輔助設計（CAD），算是一半機械一半軟體，《計算機圖形學》是必修課，也是我最喜歡的課程。熱衷於用程式碼擺平一切的我幾乎將這本教科書上的每種演算法都實現了一遍，這種重複勞動雖然意義不大，但是收穫很多，特別是丟棄了多年的數學又重新回到了腦袋中，算是最大的收穫吧

適合小白用的css幾種睡在中間（居中）的方式！！！

HTML css css3. javascript 初學者平常小白最討厭的事情就是css為什麽沒有辦法居中，現在小狐貍為大家整理幾種方式，請廣大人民群眾笑納！！！吐舌頭 1水平居中1.1 內聯元素水平居中利用 text-align: center 可以實現在塊級元素內部的內聯元素水平居

UML類圖幾種關係的總結（轉）

U在UML類圖中，常見的有以下幾種關係: 泛化（Generalization）, 實現（Realization），關聯（Association)，聚合（Aggregation），組合(Composition)，依賴(Dependency) 1. 泛化（Generalization）【泛化關

SciKit-learn快速入門教程和例項（二）

一，sklearn的常用屬性和功能繼續上次對波士頓房價預測的討論，瞭解模型的屬性和功能。 #首先匯入庫，使用的是線性迴歸 from sklearn import datasets from sklearn.linear_model import LinearRegr

Element 表單 resetFields() 驗證失效幾種不同的場景（圖示）

需求：當然是清除表單驗證（即下方紅色警告）解決：這4種寫法絕對可以解決問題了。 A：_this.$refs['formName'].resetFields(); B：if (_this.$refs['formName'] != undefined){_this

Scikit-learn快速入門教程和例項（一）

一，什麼是SKlearn SciKit learn的簡稱是SKlearn，是一個python庫，專門用於機器學習的模組。以下是它的官方網站，文件等資源都可以在裡面找到http://scikit-learn.org/stable/#。

Java實現幾種常見排序方法（下） .

插入排序的工作原理是通過構建有序序列，對於未排序資料，在已排序序列中從後向前掃描，找到相應位置並插入。其具體步驟參見程式碼及註釋。 [java] view plaincopyprint? /** * 插入排序<br/> * <ul>

UML中類之間的幾種關係，關聯（association），聚合（Aggregation），組合（Composition）

類之間可能存在以下幾種關係：關聯(association)、依賴(dependency)、聚合(Aggregation，也有的稱聚集)、組合(Composition)、泛化(generalization，也有的稱繼承）、實現(Realization)。關聯是指兩個類之間存在某種特定的對應關係，例如客戶和訂

scikit-learn幾種常用演算法的比較（code）

相關推薦