6個步驟從頭開始編寫機器學習演算法：感知器案例研究

阿新 • • 發佈：2019-02-04

摘要：通用版學習機器學習演算法的方法，你值得擁有！

從0開始編寫機器學習演算法是一種非常好的體驗

當你點選之後你會感到壓力，因為其中有些演算法比其他演算法更復雜，所以我建議你從一些簡單甚至更簡單的演算法開始，比如單層感知器。

以感知器為例從頭開始編寫演算法,主要為以下6個步驟：

1.對演算法有一個基本的瞭解；

2.找到一些不同的學習來源；

3.將演算法分解成塊；

4.從一個簡單的例子開始；

5.使用可行的實現進行驗證；

6.寫下你的過程。

1、對演算法進行基本的瞭解

如果你不瞭解基礎知識，不要從零開始編寫演算法。

至少，你應該能夠回答以下問題:

1.它是什麼?

2.它的典型用途是什麼?

3.使用條件是什麼?

對於感知器，至少能夠回答以下問題:

1.單層感知器是最基本的神經網路。它通常用於二分類問題(1或0，“是”或“否”)。

2.一些簡單的用法可能是情緒分析(積極或消極反應)或貸款違約預測(“將違約”或“將不違約”)。對於這兩種情況，決策邊界都必須是線性的。

3.如果決策邊界是非線性的，你就不能用感知器。對於這些問題，需要使用其他不同的方法。

2、使用不同的學習資源

在你對模型有了基本的瞭解之後，這個時候可以開始你的研究了。

有些人用教材學得更好，有些人用視訊學得更好。我個人喜歡到處轉轉，使用各種各樣的資源。

對於數學細節，教材講的比較詳細，但對於更實際的例子，我更喜歡部落格帖子和視訊。

對於感知器，這裡有一些很好的學習資源:

教材

統計學習基礎

https://web.stanford.edu/~hastie/Papers/ESLII.pdf

機器學習理解:從理論到演算法https://www.cs.huji.ac.il/~shais/UnderstandingMachineLearning/understanding-machine-learning-theory-algorithms.pdf

部落格

如何在Python中從Scratch開始實現感知器演算法，JasonBrownlee

https://machinelearningmastery.com/implement-perceptron-algorithm-scratch-python/

單層神經網路與梯度下降，SebastianRaschkahttps://sebastianraschka.com/Articles/2015_singlelayer_neurons.html

視訊

感知器訓練

https://www.youtube.com/watch

感知器演算法的原理

https://www.youtube.com/watch

3、將演算法分解成塊

現在我們已經收集了各種學習資源，是時候開始學習了。

與其從頭到尾讀一篇部落格文章，不如先瀏覽一下章節標題和其他重要資訊，寫下要點，並試著概述演算法。

在瀏覽了這些資料之後，我將感知器分為以下5個部分:

1.初始化權重；

2.將權重乘以輸入，然後求和；

3.將結果與閾值進行比較以計算輸出(1或0)；

4.更新權重；

5.重複以上步驟；

讓我們詳細討論每一個部分。

1.初始化權重

首先初始化權重向量。權重的數量需要與特徵的數量匹配。假設我們有三個特徵，則權重向量如下所示：

權重向量通常被初始化為0，在本文中我們將繼續使用它。

2.將權重乘以輸入，然後求和

接下來，我們將權重乘以輸入，然後求和。為了更容易理解，我在第一行中對權重及其對應的特徵進行了著色。

在權重乘以特徵之後，我們把它們加起來，這也被稱為點積。

最後的結果為0，將這個零時的結果設為f。

3.和閾值進行比較

在計算出點積之後，我們需要將它與閾值進行比較。

這裡選擇用0作為閾值，但也可以用其他值作為閾值。

由於我們計算出來的點積f不大於我們的閾值(0)，所以估計值等於0。

我將估計值表示為帶帽的y(又名“y hat”)，下標0表示第一行，也可以用1表示第一行，這無所謂。這裡選擇從0開始。

如果我們將這個結果與實際值進行比較，可以看到當前的權重沒有正確地預測實際輸出。

因為我們的預測不正確，所以進行下一步來更新權重。

4.更新權重

接下來更新權重，以下是要使用的方程：

基本原理是在迭代“n”處調整當前權重，以便在下一個迭代中得到一個新的權重“n+1”。

為了調整權重，我們需要設定一個“學習率”。這是用希臘字母“eta”表示。

這裡選擇用0.1表示學習率，也可以用其他值表示學習率，就像閾值的設定一樣。

以下是到目前為止的總結:

繼續計算在n=2時的權重。

我們已經成功地完成了感知器演算法的第一次迭代。

5.重複以上步驟

由於演算法沒有計算出正確的輸出，我們需要繼續。通常需要多次迭代，遍歷資料集中的每一行來更新權重。對資料集的一次完整遍歷稱為“epoch”。

因為資料集有3行，我們需要3次迭代才能完成1個epoch。

我們可以設定總的迭代次數或epoch來繼續執行演算法，比如指定30次迭代(或10個epochs)。

與閾值和學習率一樣，epoch的數量是一個可以隨意使用的引數。

在下一個迭代中，我們將繼續討論第二行特徵。

這裡不一一重複每一步了，以下是下一個點積的計算。

接下來，將點積和閾值進行比較，以計算新的估計值，更新權重，然後繼續。如果資料是線性可分的，感知器就會收斂。

4、從一個簡單的例子開始

現在我們已經手工將演算法分解成塊，現在用程式碼開始實現它。為了簡單起見，從一個非常小的“玩具資料集”開始。對於這種型別的問題，一個好的小的線性可分離資料集是NAND門。這是數電中常用的邏輯閘。

因為這是一個非常小的資料集，我們可以手動將其輸入到Python中。

為了讓模型計算偏差項，新增一個虛擬的特徵“x0”表示第一列。

可以將偏差看作是截距項，模型可以正確地分離這兩個類。

以下是輸入資料的程式碼:

與前一節一樣，我將逐步詳細介紹演算法，編寫程式碼並測試它。

1．初始化權重

第一步是初始化權重

請記住，權重向量的長度需要與特徵的數量相匹配。對於這個NAND門的例子，長度是3。

2．將權重乘以輸入，然後求和

接下來，我們將權重乘以輸入，然後求和(即點積)。

同樣，我們可以使用Numpy的dot()函式輕鬆地執行此操作。

我們從權重向量和第一行特徵的點積開始。

正如預期的那樣，結果是0。

為了與上一節保持一致，我將點積賦給變數f。

3.與閾值進行比較

在計算了點積之後，將結果與閾值進行比較，從而對輸出進行預測。

設定閾值z等於0。如果點積f大於0，我們的預測是1。否則，它就是零。

記住，這個預測通常是用一克拉的頂部來表示的，也被稱為“帽子”，把預測值賦給變數yhat。

正如預期的那樣，預測為0。

在上面的註釋中，將這些程式碼稱為“啟用函式”，是更正式的名稱。

檢視NAND輸出的第一行，可以看到實際值是1，由於我們的預測是錯誤的，所以需要繼續更新權重。

4．更新權重

現在已經得出了預測值，準備更新權重。

我們需要設定一個學習率才能做到這一點。為了與前面的例子保持一致，將學習率“eta”賦值為0.1。

我將對每個權重的更新進行硬編碼，使其更容易閱讀。

可以看到權重現在已經更新了，繼續下去。

5．重複以上步驟

現在我們已經完成了每一個步驟，現在是時候把所有的東西放在一起了。

最後一個還沒有討論的是損失函式，即實現最小化的函式。在例子中，這將是平方和(SSE)誤差。

這就是我們用來計算誤差的方法，看看模型是如何執行的。

把所有這些都聯絡起來，完整的函式如下所示:

現在已經編寫了感知器的所有程式碼，開始執行它：

看一看上方的誤差，可以看到誤差在第6次迭代時趨於0，對於之後的迭代，始終為0。當誤差趨於0時，表示模型收斂了。也就是說模型已經正確地“學習”了適當的權重。

在下一節中，我們將在更大的資料集上使用計算過的權重來做預測。

5、使用可行的實現進行驗證

到目前為止，我們已經找到了不同的學習資源，手動完成了演算法，並通過一個簡單的例子在程式碼中測試了它。

現在是時候將結果與可行的實現進行比較了。為了比較，我們將使用scikit-learn中的感知器。

步驟如下：

1.匯入資料；

2.將資料分成訓練/測試集；

3.訓練我們的感知器；

4.測試感知器；

5.和scikit-learn的感知器相比；

1．匯入資料

從匯入資料開始，可以在這裡獲得資料集的副本。

為了確保感知器能夠正常工作，所建立的資料集是線性可分的。為了驗證，繼續繪製資料。

上圖很容易看出資料集輕易地被一條直線分開。

在繼續之前，先來解釋繪製資料的程式碼。

使用panda匯入csv，它自動將資料放入dataframe中。

為了繪製資料，必須從dataframe中提取值，所以使用了.values方法。

特徵在第1和第2列中，所以在散點圖函式中使用了這些特徵。第0列是包含1的虛擬特徵，這樣就能計算出截距。這與我們在前一節中對NAND gate所做的事情相似。

最後，在scatterplot函式中使用c = df['3']和alpha = 0.8為兩個類著色。輸出是第3列(0或1)中的資料，因此告訴函式使用第3列為兩個類著色。

你可以在這裡找到關於Matplotlib的散點函式的更多資訊。

2．將資料分成訓練/測試集

既然我們已經確認了資料可以線性分離，那麼現在就該分離資料了。在單獨的資料集上訓練模型和測試資料集是很好的實踐，能夠避免過擬合。分離資料有不同的方法，但為了簡單起見，這裡使用一個訓練集和一個測試集。

我先整理一下我的資料。如果檢視原始檔案，你會看到資料是按輸出(第三列)中0的行進行分組的，然後是所有的1。我想要改變一下，增加一些隨機性，所以我要洗牌。

我首先將資料從dataframe改為numpy陣列。這將更容易地使用許多numpy函式，例如.shuffle。

為了讓結果重現，我設定了一個隨機種子(5)。完成後，嘗試改變隨機種子，看看結果如何變化。

接下來把70%的資料分成訓練集，30%分成測試集。

最後一步是分離訓練和測試集的特徵和輸出。

我選擇了70%/30%作為訓練/測試集，只是為了這個示例，但我希望你研究其他方法，比如k-fold交叉驗證。

3.訓練感知器

接下來，我們要訓練感知器。

這非常簡單，我們將重用在前一節中構建的程式碼。

讓我們來看看權重和平方誤差之和。

權值現在對我們來說意義不大，但我們將在下一節中使用這些數字來測試感知器，還將使用權重來比較我們的模型和scikit-learn模型。

看一下平方誤差之和，我們可以看到感知器已經收斂，這是我們期望的，因為資料是線性可分的。

4．測試感知器

現在是測試感知器的時候了。為此，我們將構建一個小型的perceptron_test函式。這和我們已經看到的很相似。這個函式使用perceptron_train函式計算的權值的點積，以及特徵，以及啟用函式來進行預測。

我們唯一沒有看到的是accuracy_score，這是一個來自scikit-learn的評估度量函式，你可以在這裡瞭解更多。

把所有這些放在一起，以下是具體的程式碼實現:

準確度為1.0表明我們的模型正確地預測了所有的測試資料。這個資料集顯然是可分離的，所以我們期望這個結果。

5、和scikit-learn的感知器相比

最後一步是將我們的結果與scikit-learn的感知器進行比較。下面是這個模型的程式碼:

現在我們已經訓練了模型，讓我們將權重與模型計算的權重進行比較。

scikit-learn模型中的權重與我們的相同，這意味著我們的模型工作正常。

在我們結束之前，有幾個小問題需要解決一下。在scikit-learn模型中，我們必須將隨機狀態設定為“None”並關閉變換，但我們已經設定了一個隨機種子並打亂了資料，所以我們不需要再這樣做了。

我們還必須將學習率“eta0”設定為0.1，以與我們的模型相同。

最後一點是截距。因為我們已經包含了一個虛擬的特徵列1s，我們正在自動擬合截距，所以我們不需要在scikit-learn感知器中開啟它。

這些看起來都是次要的細節，但如果我們不設定這些，就無法達到與我們的模型相同的結果。

這一點很重要。在使用模型之前，閱讀文件並理解所有不同設定的作用是非常重要的。

6、寫下你的過程

這個過程中的最後一步可能是最重要的。你已經完成了所有的工作，包括學習、記筆記、從頭開始編寫演算法，並將其與可行的實現進行比較，不要讓所有的好工作白白浪費掉!

寫下這個過程很重要，原因有二:

1、你會得到更深的理解，因為你正在教導別人你剛剛學到的東西。

2、你可以向潛在僱主展示它。

證明你可以從機器學習庫中實現一個演算法是一回事，但如果你可以自己從頭實現它，那就更令人印象深刻了。一個展示你作品的好方法是使用GitHub頁面組合。

結論

在這篇文章中，我們學習瞭如何從零開始編寫實現感知器。更重要的是，我們學習瞭如何找到有用的學習資源，以及如何將演算法分解成塊。

然後，我們學習瞭如何使用一個玩具資料集在程式碼中實現和測試演算法。

最後，我們通過比較我們的模型和可行實現的結果來結束本文。要獲得使用的Python程式碼的完整副本，單擊下面的綠色按鈕。

這是在更深層次上學習演算法的一個很好的方法，這樣就可以自己實現它了。

大多數情況下，你將使用可行的實現，但如果你真的想深入瞭解底層的情況，從頭實現它是一個很好的練習。

本文由阿里云云棲社群組織翻譯。

文章原標題《machine-learning-from-scratch》

作者：dataoptimal 譯者：虎說八道，審校：。

640?wx_fmt=jpeg

end

6個步驟從頭開始編寫機器學習演算法：感知器案例研究

摘要：通用版學習機器學習演算法的方法，你值得擁有！從0開始編寫機器學習演算法是一種非常好的體驗當

只需6步，從頭開始編寫機器學習演算法

從頭開始編寫演算法是一種有益的體驗，當你最終點選執行的那一刻，你會了解演算法背後真正發生了什麼。如果你以前用scikit-learn實現過這個演算法，從頭開始編寫就會很容易？不是這樣。有些演算法只是比其他演算法更復雜，所以可以從簡單的開始，比如單層感知器（Percep

教你6步從頭寫機器學習演算法——以感知機演算法為例

自己從頭寫一個演算法，不僅能給你帶來成就感，也能幫你真正理解演算法的原理。可能你之前用 Scikit-learn 實現過演算法，但是從零開始寫個演算法簡單嗎？絕對不簡單。有些演算法要比其它演算法複雜的多，所以在寫演算法時可以先從簡單的開始，比如單層的感知機。下面就介紹機器學家 John S

第一個機器學習演算法：線性迴歸與梯度下降

# 第一個機器學習演算法：線性迴歸與梯度下降 ## 符號解釋 * $x^{(i)}$,$y^{(i)}$：某個訓練樣本 * $m$：樣本總數量 * $h_{\theta}$：假設函式 ## Linear regression（線性迴歸） ### 如何獲得一個線性迴歸模型？ * 將**訓練資料**放入

數學推導+純Python實現機器學習演算法：邏輯迴歸

自本系列第一講推出以來，得到了不少同學的反響和贊成，也有同學留言說最好能把數學推導部分寫的詳細點，筆者只能說盡力，因為打公式實在是太浪費時間了。。本節要和大家一起學習的是邏輯（logistic）迴歸模型，繼續按照手推公式+純 Python 的寫作套路。邏輯迴歸本質上跟邏輯這個詞不是很搭邊，叫這個名字完

機器學習演算法：迴歸分析與工程應用

一、線性迴歸 1.1 定義與定義引入（一）什麼是線性迴歸呢？有監督學習輸出/預測的結果yi為連續值變數需要學習對映f：x->y 假定輸入x和輸出y之間有線性相關關係（二）舉一個例子（單一變數）：（三）多變數的情況

機器學習演算法：交叉驗證——（監督）學習器效能評估方法 [ sklearn.model_selection.cross_val_score()官方翻譯 ]

交叉驗證——（監督）學習器效能評估方法一、思考：交叉驗證有什麼好值得我們使用的？每個演算法模型都需要經過兩個階段：訓練和驗證。 1）一般情況下的，我們用的方法是：將原始資料集分為訓練資料集 & 測試資料集。優點：是，但僅僅是思路正確。缺點：思

機器學習演算法：Logistic迴歸學習筆記

一、Logistic Regression的理解角度一：輸入變數X服從logistic分佈的模型

機器學習演算法：kNN(K-Nearest Neighbor)最鄰近規則分類

KNN最鄰近規則，主要應用領域是對未知事物的識別，即判斷未知事物屬於哪一類，判斷思想是，基於歐幾里得定理，判斷未知事物的特徵和哪一類已知事物的的特徵最接近； K最近鄰(k-Nearest Neighbor，KNN)分類演算法，是一個理論上比較成熟的方法，也是最簡單的機器

新興機器學習演算法：從無監督降維到監督降維

1.前言機器學習領域中所謂的降維就是指採用某種對映方法，將原高維空間中的資料點對映到低維度的空間中。降維的本質是學習一個對映函式 f : x->y，其中x是原始資料點的表達，目前最多使用向量

機器學習演算法【感知機演算法PLA】【5分鐘讀完】

本來想說3分鐘可以讀完的，但是想到自己的表達水平。我覺得可能需要多出2分鐘來理解我說的話。感知機演算法一開始這個名字，不懂的人覺得這個逼格很高，感覺很厲害的樣子，其實這個演算法很水的…. 對於這個演算法，我們只需要知道下面這幾樣東西： 1.

新興機器學習演算法：遷移學習

1.前言在面對某一領域的具體問題時，通常可能無法得到構建模型所需規模的資料。然而在一個模型訓練任務中針對某種型別資料獲得的關係也可以輕鬆地應用於同一領域的不同問題。這種技術也叫做遷移學習（Tran

小白必看學習PHP的6個步驟10個技巧

php 教程在這個終身學習的時代，資訊泛濫的時代，我們需要的能力並不是去背誦相應的知識點，而是掌握學習方式。學習PHP也是如此，有時候技巧和步驟比埋頭苦幹要有效得多。下面小編就和大家分享一下學習PHP的6個步驟（僅僅是簡單概括）和10個技巧。 1、首先需要熟悉HTML/CSS/JS等網頁基本元素，完

使用Python從頭開始實現基線機器學習演算法

使用Python從頭開始實現基線機器學習演算法在預測建模問題上建立基線效能非常重要。基線為您稍後評估的更高階方法提

從頭開始編寫一個實時嵌入式操作系統的內核（一）

rtos signed 語言配置 ffd ldr 進行 first special 今年大四，在準備自己的畢業設計。因為畢設題目是一個比較復雜的多傳感器監控的嵌入式系統，然後最近自己有使用一些rtos，比方說freertos和ucos，感覺比起單純對單片機的裸機開發還是有

轉：從頭開始編寫基於隱含馬爾可夫模型HMM的中文分詞器

lan reverse single trim 地址 note str rip resources http://blog.csdn.net/guixunlong/article/details/8925990 從頭開始編寫基於隱含馬爾可夫模型HMM的中文分詞器之一 - 資

資料分析師最常用的10個機器學習演算法

在機器學習領域，有種說法叫做“世上沒有免費的午餐”，簡而言之，它是指沒有任何一種演算法能在每個問題上都能有最好的效果，這個理論在監督學習方面體現得尤為重要。舉個例子來說，你不能說神經網路永遠比決策樹好，反之亦然。模型執行被許多因素左右，例如資料集的大小和結構。

0基礎大資料程式設計怎麼學？三個步驟+加一套完整學習體系教你入門

對於零基礎的朋友，一開始入門可能不會太簡單。大資料零基礎怎麼學?大資料零基礎學什麼?難嗎？要學習大資料你至少應該知道什麼是大資料，大資料一般運用在什麼領域。對大資料有一個大概的瞭解，你才能清楚自己對大資料究竟是否有興趣你知道什麼是大資料嗎? 要學習大資料你首先應該知道什麼是大資料，大資料一般運用在什麼領

0基礎大數據編程怎麽學？三個步驟+加一套完整學習體系教你入門

重載適合 process 你會 prot 分析國內初學者 mark 對於零基礎的朋友，一開始入門可能不會太簡單。大數據零基礎怎麽學?大數據零基礎學什麽?難嗎？要學習大數據你至少應該知道什麽是大數據，大數據一般運用在什麽領域。對大數據有一個大概的了解，你才能清楚自己對大

寫的不錯，轉--讓我們從NodeJS Streams開始從頭開始編寫一個Web伺服器

看完這篇文章後，真心的感覺閱讀原始碼的好處 Let's code a web server from scratch with NodeJS Streams https://www.codementor.io/ziad-saab/let-s-code-a-web-server-from-sc

6個步驟從頭開始編寫機器學習演算法：感知器案例研究

相關推薦