[Python-程式碼實現]統計學習方法之感知機模型

阿新 • • 發佈：2018-12-03

內容簡介

感知機模型 - 手寫 Coding
使用手寫模型進行鳶尾花分類
使用 sklearn 中的感知機進行鳶尾花分類

感知機模型 - 手寫 Coding

class Model:
"""感知機模型"""
    def __init__(self, data):
        """選取初值 w, b, η"""
        self.w = np.zeros(len(data[0]) - 1, dtype=np.float32)  # 引數 w 應與 x 等量
        self.b = 0
        self.η = 
 0.1

    def sign(self, x):
        """感知機模型"""
        y = np.dot(self.w, x) + self.b
        return 1 if y >= 0 else -1

    def fit(self, x_train, y_train):
        """模型訓練"""
        while True:
            for d, x in enumerate(x_train):  # 取出一條資料
                y = y_train[d]  # 取出對應資料的 target 

                if y * self.sign(x) <= 0:  # 分類不正確進行引數更迭
                    self.w = self.w + np.dot(self.η * y, x)
                    self.b = self.b + self.η * y
                    break  # 發生更迭即存在分類錯誤，從頭再來
            else:  # 沒有發生更迭即全部分類正確，停止訓練
                break

        return self.w, 
 self.b

使用手寫模型進行鳶尾花分類

import pandas as pd
import numpy as np
from sklearn.datasets import load_iris
import matplotlib.pyplot as plt


def main():
    # 一、載入資料
    iris = load_iris()

    # 二、提取輸入與輸出資料
    # 為輸入特徵建立 Frame，並使用特徵名稱作為列標題(注意不是列索引)
    df = pd.DataFrame(iris.data, columns=iris.feature_names)
    # 新增輸出列 target
    df['target'] = iris.target
    # 給 Frame 新增列索引(只有加了索引才可以使用索引)
    df.columns = ['sepal length', 'sepal width', 'petal length', 'petal width', 'target']
    # 列印輸出值分佈情況
    print(df.target.value_counts())

    # 三、繪出資料並觀察分佈情況
    # 通過 frame 能夠看出資料是 50 間隔分佈，因此可以以 50 間隔分別取出
    plt.scatter(df[:50]['sepal length'], df[:50]['sepal width'], label='0')
    plt.scatter(df[50:100]['sepal length'], df[50:100]['sepal width'], label='1')
    plt.xlabel('sepal length')
    plt.ylabel('sepal width')
    plt.legend()
    plt.show()

    # 四、特徵提取與目標值提取
    # 使用 iloc 選取前 100 條資料的第 0, 1, -1 列，並轉換為 array
    data = np.array(df.iloc[:100, [0, 1, -1]])
    # 將 第 0, 1 列資料賦值給 x，將 第 -1 列資料賦值給 y
    x_train, y_train = data[:, :-1], data[:, -1]
    # 將 y 值進行 1, -1分類
    y_train = np.array([i if i == 1 else -1 for i in y_train])

    # 五、感知機模型訓練
    perceptron = Model(data)
    w, b = perceptron.fit(x_train, y_train)

    # 六、繪出判定邊界
    # 分離超平面為 w[0]x_1 + w[1]x_2 + b = 0
    x_1 = np.linspace(4, 7, 10)
    x_2 = -(w[0] * x_1 + b) / w[1]
    plt.plot(x_1, x_2)
    plt.scatter(df[:50]['sepal length'], df[:50]['sepal width'], label='0')
    plt.scatter(df[50:100]['sepal length'], df[50:100]['sepal width'], label='1')
    plt.xlabel('sepal length')
    plt.ylabel('sepal width')
    plt.legend()
    plt.show()


if __name__ == '__main__':
    main()

使用 sklearn 中的感知機進行鳶尾花分類

import pandas as pd
import numpy as np
from sklearn.datasets import load_iris
from sklearn.linear_model import Perceptron
import matplotlib.pyplot as plt


def main():
    # 一、載入資料
    iris = load_iris()

    # 二、提取輸入與輸出資料
    # 為輸入特徵建立 Frame，並使用特徵名稱作為列標題(注意不是列索引)
    df = pd.DataFrame(iris.data, columns=iris.feature_names)
    # 新增輸出列 target
    df['target'] = iris.target
    # 給 Frame 新增列索引(只有加了索引才可以使用索引)
    df.columns = ['sepal length', 'sepal width', 'petal length', 'petal width', 'target']

    # 三、特徵提取與目標值提取
    # 使用 iloc 選取前 100 條資料的第 0, 1, -1 列，並轉換為 array
    data = np.array(df.iloc[:100, [0, 1, -1]])
    # 將 第 0, 1 列資料賦值給 x，將 第 -1 列資料賦值給 y
    x_train, y_train = data[:, :-1], data[:, -1]
    # 將 y 值進行 1, -1分類
    y_train = np.array([i if i == 1 else -1 for i in y_train])

    # 四、使用SKlearn感知機進行模型訓練
    clf = Perceptron()
    clf.fit(x_train, y_train)
    w = clf.coef_[0]  # w
    b = clf.intercept_  # b

    # 五、繪出判定邊界
    # 分離超平面為 w[0]x_1 + w[1]x_2 + b = 0
    x_1 = np.linspace(4, 7, 10)
    x_2 = -(w[0] * x_1 + b) / w[1]
    plt.plot(x_1, x_2)
    plt.scatter(df[:50]['sepal length'], df[:50]['sepal width'], label='0')
    plt.scatter(df[50:100]['sepal length'], df[50:100]['sepal width'], label='1')
    plt.xlabel('sepal length')
    plt.ylabel('sepal width')
    plt.legend()
    plt.show()


if __name__ == '__main__':
    main()

希望對你有所幫助，點個贊哇大兄dei！
個人部落格：http://xingtu.info
GitHub：https://github.com/BreezeDawn/MachineLearning

[Python-程式碼實現]統計學習方法之感知機模型

內容簡介感知機模型 - 手寫 Coding 使用手寫模型進行鳶尾花分類使用 sklearn 中的感知機進行鳶尾花分類感知機模型 - 手寫 Coding class Model: """感知機模型""" def __init__(s

統計學習方法(2)——感知機原始形式、對偶形式及Python實現

感知機作為一種最簡單的線性二分類模型，可以在輸入空間（特徵空間）將例項劃分為正負兩類。本文主要介紹感知機兩種形式對應的學習演算法及Python實現。　感知機學習演算法的原始形式對於輸入空間，感知機通過以下函式將其對映至{+1，-1}的輸出空間

《李航：統計學習方法》--- 感知機演算法原理與實現

感知機模型感知機是一個二類分類的線性分類模型。所謂二類分類就是它只能將例項分為正類和負類兩個類別。那麼為什麼是線性分類模型呢，我的理解是感知機學習旨在求出可以將資料進行劃分的分離超平面，而分離超平面的方程 w⋅x+b=0 為線性方程，所以感知機為線性分類模型

統計學習方法二感知機

ges 數據集函數分類步長例題算法損失函數 width 感知機（一）概念　　　　　　　　 1，定義：　　　　　　　　（二），學習策略 1，線性可分：存在一個超平面將正實例和負實例劃分開來，反之不可分 2，學習策略：尋找極小損失函數，通過計算誤分點到超平

李航統計學習方法之樸素貝葉斯法（含python及tensorflow實現）

樸素貝葉斯法樸素貝葉斯法數學表示式後驗概率最大化的含義樸素貝葉斯是一個生成模型。有一個強假設：條件獨立性。我們先看下樸素貝葉斯法的思想，然後看下條件獨立性具體數學表示式是什麼樣的。

最小二乘迴歸樹Python實現——統計學習方法第五章課後題

李航博士《統計學習方法》第五章第二題，試用平方誤差準則生成一個二叉迴歸樹。輸入資料為： x 0 1 2 3

三十八、100行python程式碼實現機器學習自動分類

現在朋友圈、公眾號、微博資訊應接不暇，以微信公眾號舉例，看技術極客是怎麼自動篩出自己想看的文章的，100行機器學習程式碼就能自動幫你歸好類，要想找出想看的和不想看的，你再也不用刷朋友圈了準備工作 1. 準備一張mysql資料庫表，至少包含這些列：id、title(文章標題)、content(文章內

（轉載）李航博士的統計學習方法的python程式碼實現及資料下載

《統計學習方法》可以說是機器學習的入門寶典，許多機器學習培訓班、網際網路企業的面試、筆試題目，很多都參考這本書。本站根據網上資料用Python復現了課程內容，並提供本書的程式碼實現、課件下載。《統計學習方法》，作者李航，本書全面系統地介紹了統計學習的主要方法，特別是監督學習方法，包括感

【用python實現《統計學習方法》】之決策樹C4.5/ID3

宣告：本文根據李航博士的《統計學校方法》中的決策樹章節的原理：最大熵資訊增益、資訊增益比進行決策樹的實現。在視覺化方面主要參考的這篇博文。決策樹演算法是一類在資料探勘中應用的特別多的符號學派分類器，並在整合學習中被大大采用。經典的c4.5和id3以及後來的c

統計學習方法第二章例題2.2程式碼實踐，感知機的對偶形式的程式碼實現

def judge_functon(dataMat,labels,labelsMat,b,m,AMat): for i in range(m): if (labels[i] * (sum(multiply(dataMat * dataMat[i].T, multiply(AMat, l

統計學習方法ｃ++實現之一　感知機

感知機前言最近學習了c++，俗話說‘光說不練假把式’，所以決定用c++將《統計學習方法》裡面的經典模型全部實現一下，程式碼在這裡，請大家多多指教。感知機雖然簡單，但是他可以為學習其他模型提供基礎，現在先簡單回顧一下基礎知識。感知機模型上圖就是簡單的感知機模型，其中$f$ 我們一般取

統計學習方法ｃ++實現之二　k近鄰法

統計學習方法ｃ++實現之二 k近鄰演算法前言 k近鄰演算法可以說概念上很簡單，即：“給定一個訓練資料集，對新的輸入例項，在訓練資料集中找到與這個例項最鄰近的k個例項，這k個例項的多數屬於某個類，就把該輸入分為這個類。”其中我認為距離度量最關鍵，但是距離度量的方法也很簡單，最長用的就是歐氏距離，其他的距離

統計學習方法ｃ++實現之三　樸素貝葉斯法

樸素貝葉斯法前言樸素貝葉斯法是基於貝葉斯定理與特徵條件獨立假設的分類方法，這與我們生活中判斷一件事情的邏輯有點類似，樸素貝葉斯法的核心是引數的估計，在這之前，先來看一下如何用樸素貝葉斯法分類。程式碼地址https://github.com/bBobxx/statistical-learning,歡

資源下載| 機器學習經典書籍《統計學習方法》(Python3.6)程式碼實現(及課件)

本文來自GitHub黃海廣《統計學習方法》可以說是機器學習的入門寶典，許多機器學習培訓班、網際網路企業的面試、筆試題目，很多都參考這本書。本站根據網上資料用Python復現了課程內容，並提供本書的程式碼實現、課件下載。《統計學習方法》，作者李航，本書全面系統地介紹了統計學習的主要方法，特

《統計學習方法》樸素貝葉斯極大使然估計 Python實現

程式碼可在Github上下載:程式碼下載今天看了一下《統計學習方法》的樸素貝葉斯的演算法，然後結合參考了《機器學習實戰》一些程式碼。用Python實現了一下例4.1。實現的是P50頁的例4.1，先簡單說下公式。 $$y=argmax_{y_k}{P(Y=y_k)\p

第1章統計學習方法概論(LeastSquaresMethod)程式碼實現

上一篇：【目錄】====== 【回到目錄】====== 下一篇：【第一章課後習題參考解答】 import numpy as np from scipy.optimize import leastsq import matplot

《統計學習方法》各章節程式碼實現與課後習題參考解答

程式碼參考：傳送門待完成。。。《統計學習方法》各章節程式碼實現與課後習題參考解答章節程式碼課後習題第1章統計學習方法概論(LeastSquaresMethod)

《統計學習方法》+樸素貝葉斯演算法+C++程式碼（簡單）實現

首先，學習樸素貝葉斯演算法得了解一些基本知識，比如全概率公式和貝葉斯公式，這些知識隨便找一本書或者在網上都能夠獲得。在此，這裡僅關注貝葉斯演算法本身，以及其具體的實現（以例4.1的例子為參考）。貝葉斯演算法：程式設計實現以上演算法，

【統計學習方法】k近鄰 kd樹的python實現

前言程式碼可在Github上下載:程式碼下載 k近鄰可以算是機器學習中易於理解、實現的一個演算法了，《機器學習實戰》的第一章便是以它作為介紹來入門。而k近鄰的演算法可以簡述為通過遍歷資料集的每個樣本進行距離測量，並找出距離最小的k個點。但是這樣一來一旦樣本數目龐大的時候

統計學習方法感知機(附簡單模型程式碼)

1. 感知機模型輸入為例項的特徵向量，輸出為例項的類別，取+1和-1；感知機對應於輸入空間中將例項劃分為正負兩類的分離超平面，屬於判別模型；匯入基於誤分類的損失函式；利用梯度下降法對損失函式進行極小化；感知機學習演算法具有簡單而易於實現的優點，分為原始形式和對偶形式；1957年由Ros

[Python-程式碼實現]統計學習方法之感知機模型

內容簡介

感知機模型 - 手寫 Coding

使用手寫模型進行鳶尾花分類

使用 sklearn 中的感知機進行鳶尾花分類

相關推薦