利用 sklearn SVM 分類器對 IRIS 資料集分類

阿新 • • 發佈：2018-11-25

利用 sklearn SVM 分類器對 IRIS 資料集分類

支援向量機（SVM）是一種最大化分類間隔的線性分類器（如果不考慮核函式）。通過使用核函式可以用於非線性分類。SVM 是一種判別模型，既適用於分類也適用於迴歸問題，標準的 SVM 是二分類器，可以採用 “one vs one” 或 “one vs rest” 策略解決多分類問題。

https://charlesliuyx.github.io/2017/09/19/支援向量機SVM學習筆記/

sklearn 工具包提供了用於二分類或多分類以及迴歸的實現。參考：http://sklearn.apachecn.org/cn/0.19.0/modules/svm.html#svm-kernels

例如：

from sklearn import svm
clf = svm.SVC(attr_name1=value1, ...)
clf.fit(X,Y)
y_predict = clf.predict(y_test)

其中，構造器中常用的引數有：

C : 懲罰係數（預設為 1.0）

kernel : “rbf” | “linear” | “poly” | “sigmoid” | … (預設為“rbf”)

在這裡插入圖片描述

probability : Ture | False (預設為False)

decision_function_shape : “ovr” | “ovo” (預設為“ovr”)

分別採用 linear 和 rbf 核對 IRIS 資料集進行分類，採用“one vs one”策略。

# -*- coding: utf-8 -*-
from sklearn import datasets
from sklearn import svm
import numpy as np

if __name__ == '__main__':

    iris = datasets.load_iris( 
) 
    print(type(iris), dir(iris))

    x = iris.get('data')
    y = iris.get('target')

    # 隨機劃分訓練集和測試集
    num = x.shape[0] # 樣本總數
    ratio = 7/3 # 劃分比例，訓練集數目:測試集數目
    num_test = int(num/(1+ratio)) # 測試集樣本數目
    num_train = num -  num_test # 訓練集樣本數目
    index = np.arange(num) # 產生樣本標號
    np.random.shuffle(index) # 洗牌
    x_test = x[index[:num_test],:] # 取出洗牌後前 num_test 作為測試集
    y_test = y[index[:num_test]]
    x_train = x[index[num_test:],:] # 剩餘作為訓練集
    y_train = y[index[num_test:]]

    clf_linear = svm.SVC(decision_function_shape="ovo", kernel="linear")
    clf_rbf = svm.SVC(decision_function_shape="ovo", kernel="rbf")
    clf_linear.fit(x_train, y_train)
    clf_rbf.fit(x_train, y_train)

    y_test_pre_linear = clf_linear.predict(x_test)
    y_test_pre_rbf = clf_rbf.predict(x_test)

    
    # 計算分類準確率
    acc_linear = sum(y_test_pre_linear==y_test)/num_test
    print('linear kernel: The accuracy is', acc_linear) 
    acc_rbf = sum(y_test_pre_rbf==y_test)/num_test
    print('rbf kernel: The accuracy is', acc_rbf)

利用 sklearn SVM 分類器對 IRIS 資料集分類

利用 sklearn SVM 分類器對 IRIS 資料集分類支援向量機（SVM）是一種最大化分類間隔的線性分類器（如果不考慮核函式）。通過使用核函式可以用於非線性分類。SVM 是一種判別模型，既適用於分類也適用於迴歸問題，標準的 SVM 是二分類器，可以採用 “one vs one”

基於決策樹模型對 IRIS 資料集分類

基於決策樹模型對 IRIS 資料集分類文章目錄基於決策樹模型對 IRIS 資料集分類 1 python 實現載入資料集視覺化資料集分類和預測計算準確率 2 基於MATLA

基於 K-Means 對 IRIS 資料集分類

基於sklearn 對 IRIS 資料集分類關於聚類聚類（Clustering）是一種無監督學習(unsupervised learning)，簡單地說就是把相似的物件歸到同一簇中。簇內的物件越相似，聚類的效果越好。關於 K-Means Ｋ-Means演算法是最為經典的

Tensorflow學習教程------利用卷積神經網路對mnist資料集進行分類_利用訓練好的模型進行分類

#coding:utf-8 import tensorflow as tf from PIL import Image,ImageFilter from tensorflow.examples.tutorials.mnist import input_data def imageprepare(ar

基於Darknet框架訓練分類器（cifar10資料集）+windows

參考 https://pjreddie.com/darknet/train-cifar/ 1 下載資料集 https://pjreddie.com/media/files/cifar.tgz 在該網址下下載cifar資料集，並解壓在darknet.exe

卷積神經網路對CIFAR資料集分類

本例通過一個具有全域性平局池化層的神經網路對CIFAR資料集分類 1.匯入標頭檔案引入資料集這部分使用cifar10_input裡面的程式碼，在cifar10資料夾下建立卷積檔案，部分程式碼如下： import cifar10_input import tensorf

Python 3實現k-鄰近演算法以及 iris 資料集分類應用

前言這個周基本在琢磨這個演算法以及自己利用Python3 實現自主程式設計實現該演算法。持續時間比較長，主要是Pyhton可能還不是很熟練，走了很多路，基本是一邊寫一邊學。不過，總算是基本搞出來了。不多說，進入正題。 1. K-鄰近演算法 1.1

用樸素貝葉斯對wine資料集分類

該實驗的資料集是MostPopular Data Sets（hits since 2007）中的wine資料集，這是是對在義大利同一地區生產的三種不同品種的酒，做大量分析所得出的資料。這些資料包括了三種酒中13種不同成分的數量。經過幾天對資料集以及分類演算法的研究，詳細研

XGBoost實現對鳶尾花資料集分類預測

code:import xgboost as xgb import numpy as np import pandas as pd from sklearn.model_selection import

計算機視覺（四）：使用K-NN分類器對CIFAR-10進行分類

1 - 引言之前我們學習了KNN分類器的原理，現在讓我們將KNN分類器應用在計算機視覺中，學習如何使用這個演算法來進行圖片分類。 2 - 準備工作建立專案結構如圖所示在datasets檔案中下載資料集Cifar-10 k_nearest_neighbo

人工智慧深度學習TensorFlow通過感知器實現鳶尾花資料集分類

一.iris資料集簡介 iris資料集的中文名是安德森鳶尾花卉資料集，英文全稱是Anderson’s Iris data set。iris包含150個樣本，對應資料集的每行資料。每行資料包含每個樣本的四個特徵和樣本的類別資訊，所以iris資料集是一個150行5列的二維表。通俗地說，iris

15 SVM - 程式碼案例二 - 鳶尾花資料不同分類器效果比較

SVM的章節已經講完，具體內容請參考：《01 SVM - 大綱》《14 SVM - 程式碼案例一 - 鳶尾花資料SVM分類》回顧案例一中的標頭檔案： import numpy as np import pandas as pd import matplotlib as mpl import matp

利用softmax函式對mnist資料集簡單分類

mnist資料集的特點每一張圖片包含28**28個畫素，我們把這一個陣列展開成一個向量，長度是28*28=784。因此在 MNIST訓練資料集中mnist.train.images 是一個形狀為 [60000, 784] 的張量，第一個維度數字用來索引圖片

資料探勘-K-近鄰分類器-Iris資料集分析-使用K-近鄰分類器進行分類預測(四)

# coding: utf-8 #使用 scikit-learn庫的K-近鄰分類器完成分類 #1. 首先將資料集中的資料進行打亂 #2. 將資料分為訓練集和測試集兩部分 #3. 使用 k-means分類器進行分類訓練，得到預測模型 #4. 使用模型對測試集進行測試，並與真實

[Java][機器學習]用決策樹分類演算法對Iris花資料集進行處理

Iris Data Set是很經典的一個數據集，在很多地方都能看到，一般用於教學分類演算法。這個資料集在UCI Machine Learning Repository裡可以找到（還是下載量排第一的資料喲）。這個資料集裡面，每個資料都包含4個值(sepal len

利用隨機森林和梯度替身決策樹對titanic資料進行分類，並對結果進行分析

import pandas as pd from sklearn.cross_validation import train_test_split from sklearn.feature_extraction import DictVectorizer from skle

sklearn訓練感知器用iris數據集

proc load %d gre 通過 lin tro 感知 misc 簡化版代碼 1 from sklearn import datasets 2 import numpy as np 3 4 #獲取data和類標 5 iris = datasets.loa

【SciKit-Learn學習筆記】5：核SVM分類和預測乳腺癌資料集

學習《scikit-learn機器學習》時的一些實踐。常用引數引數C SVM分類器svm.SVC()中的引數C即SVM所優化的目標函式 a

TensorFlow-cifar訓練與測試（可對自己資料進行分類和測試）

第一部分：測試軟硬體硬體：NVIDIA-GTX1080 軟體：Windows7、python3.6.5、tensorflow-gpu-1.4.0 第二部分：資料下載資料集下載連結第三部分：程式碼分步展示第一步：匯入tensorflow import os fr

keras RNN、LSTM對IMDB資料集進行分類

本文介紹如何基於keras採用RNN和LSTM對IMDB資料集進行分類。示例程式碼： from keras.layers import SimpleRNN from keras.models import Sequential from keras.layers import Embedd

利用 sklearn SVM 分類器對 IRIS 資料集分類

利用 sklearn SVM 分類器對 IRIS 資料集分類

相關推薦