機器學習之神經網路及python實現

阿新 • • 發佈：2018-12-15

神經網路在機器學習中有很大的應用，甚至涉及到方方面面。本文主要是簡單介紹一下神經網路的基本理論概念和推算。同時也會介紹一下神經網路在資料分類方面的應用。

首先，當我們建立一個迴歸和分類模型的時候，無論是用最小二乘法（OLS）還是最大似然值（MLE）都用來使得殘差達到最小。因此我們在建立模型的時候，都會有一個loss function。

而在神經網路裡也不例外，也有個類似的loss function。

對迴歸而言：

對分類而言：

然後同樣方法，對於W開始求導，求導為零就可以求出極值來。

關於式子中的W。我們在這裡以三層的神經網路為例。先介紹一下神經網路的相關引數。

第一層是輸入層，第二層是隱藏層，第三層是輸出層。

在X1，X2經過W1的加權後，達到隱藏層，然後經過W2的加權，到達輸出層

其中，

我們有：

至此，我們建立了一個初級的三層神經網路。

當我們要求其的loss function最小時，我們需要逆向來求，也就是所謂的backpropagation。

我們要分別對W1和W2進行求導，然後求出其極值。

從右手邊開始逆推，首先對W2進行求導。

代入損失函式公式：

然後，我們進行化簡：

化簡到這裡，我們同理再對W1進行求導。

我們可以發現當我們在做bp網路時候，有一個逆推回去的誤差項，其決定了loss function 的最終大小。

在實際的運算當中，我們會用到梯度求解，來求出極值點。

總結一下來說，我們使用向前推進來理順神經網路做到迴歸分類等模型。而向後推進來計算他的損失函式，使得引數W有一個最優解。

當然，和線性迴歸等模型相類似的是，我們也可以加上正則化的項來對W引數進行約束，以免使得模型的偏差太小，而導致在測試集的表現不佳。

Python 的實現：

使用了KERAS的庫

解決線性迴歸：

model.add(Dense(1, input_dim=n_features, activation='linear', use_bias=True))

# Use mean squared error for the loss metric and use the ADAM backprop algorithm 

model.compile(loss='mean_squared_error', optimizer='adam')

# Train the network (learn the weights)
# We need to convert from DataFrame to NumpyArray
history = model.fit(X_train.values, y_train.values,  epochs=100, 
                    batch_size=1, verbose=2, validation_split=0)

解決多重分類問題：

# create model
model = Sequential()
model.add(Dense(64, activation='relu', input_dim=n_features))
model.add(Dropout(0.5))
model.add(Dense(64, activation='relu'))
model.add(Dropout(0.5))
# Softmax output layer
model.add(Dense(7, activation='softmax'))

model.compile(loss='categorical_crossentropy', optimizer='adam', metrics=['accuracy'])

model.fit(X_train.values, y_train.values, epochs=20, batch_size=16)

y_pred = model.predict(X_test.values)

y_te = np.argmax(y_test.values, axis = 1)
y_pr = np.argmax(y_pred, axis = 1)

print(np.unique(y_pr))

print(classification_report(y_te, y_pr))

print(confusion_matrix(y_te, y_pr))

當我們選取最優引數時候，有很多種解決的途徑。這裡就介紹一種是gridsearchcv的方法，這是一種暴力檢索的方法，遍歷所有的設定引數來求得最優引數。

from sklearn.model_selection import GridSearchCV

def create_model(optimizer='rmsprop'):
    model = Sequential()
    model.add(Dense(64, activation='relu', input_dim=n_features))
    model.add(Dropout(0.5))
    model.add(Dense(64, activation='relu'))
    model.add(Dropout(0.5))
    model.add(Dense(7, activation='softmax'))
    model.compile(loss='categorical_crossentropy', optimizer=optimizer, metrics=['accuracy'])
    
    return model

model = KerasClassifier(build_fn=create_model, verbose=0)

optimizers = ['rmsprop']
epochs = [5, 10, 15]
batches = [128]


param_grid = dict(optimizer=optimizers, epochs=epochs, batch_size=batches, verbose=['2'])
grid = GridSearchCV(estimator=model, param_grid=param_grid)

grid.fit(X_train.values, y_train.values)

機器學習之神經網路及python實現

神經網路在機器學習中有很大的應用，甚至涉及到方方面面。本文主要是簡單介紹一下神經網路的基本理論概念和推算。同時也會介紹一下神經網路在資料分類方面的應用。首先，當我們建立一個迴歸和分類模型的時候，無論是用最小二乘法（OLS）還是最大似然值（MLE）都用來使得殘差達到最小。因此我們在建立模型的時候，都會有一個l

python機器學習之神經網路(二)

來自：http://blog.csdn.net/cui134/article/details/26823101 由於Rosenblatt感知器的侷限性，對於非線性分類的效果不理想。為了對線性分類無法區分的資料進行分類，需要構建多層感知器結構對資料進行分類，多層感

機器學習之神經網路：離線安裝tensorflow

Python學習中安裝方面是一個大坑，後面我會把所有的安裝過程都總結下來，這裡先推送一個tensorflow的安裝，大家不用慌，按照下面的過程一步一步來. 1、準備工作電腦安裝好anaconda，python（python，我是強烈推薦使用anaconda，

系統學習機器學習之神經網路（十一） --TDNN

近來在瞭解卷積神經網路（CNN），後來查到CNN是受語音訊號處理中時延神經網路（TDNN）影響而發明的。本篇的大部分內容都來自關於TDNN原始文獻【1】的理解和整理。該文寫與1989年，在識別"B", "D", "G"三個濁音中得到98.5%的準確率，高於HMM的93.7%。是CNN的先驅。 &

機器學習之神經網路（機器學習技法）

神經網路的動機感知器的線性融合前面我們知道了將簡單的模型進行融合之後會得到一個非常強大的模型。我們試著將感知器（簡單的二元分類模型）做線性融合之後得到下圖：其中每一個節點都是一個感知器，其第一層的感知器都是由前一層X向量與W權重的線性組合，而第二層的感知器又是由前一層的得到的

人工智慧、機器學習、神經網路及深度學習關係

前段時間看了不少關於人工智慧方面的書籍部落格和論壇，深深覺得了人工智慧是個大坑，裡面有太多的知識點和學科，要想深入絕非易事，於是萌發了自己寫一些部落格把自己的學習歷程和一些知識點筆記都記錄下來的想法，給自己一個總結收穫，同時監督自己的動力，這樣咱也算是“有監督學習”了：）這裡提到了“有監督學習

機器學習——感知器演算法及python實現

說明：本文從自己的理解出發來講解感知器是如何訓練的，如想知道比較學術的概念，請查閱相關論文。 1、什麼是感知器本文假設資料為：二維二類、線性可分感知器就是一個分類器，如：給兩類資料做訓練集A,B，訓練完成之後，給定一個測試資料，通過感知器，可以分成A或B。因為資料是二

【十】機器學習之路——logistic迴歸python實現

前面一個部落格機器學習之路——logistic迴歸講了logistic迴歸的理論知識，現在咱們來看一下logistic迴歸如何用python來實現，程式碼、資料參考《機器學習實戰》。首先看下我們要處理的資料，我們要做的就是通過logistic

【機器學習】神經網路及BP推導

1 前向傳播這裡的推導都用矩陣和向量的形式，計算單個變數寫起來太麻煩。矩陣、向量求導可參見上面參考的部落格，個人覺得解釋得很直接很好。前向傳播每一層的計算如下： z(l+1)=W(l,l+1)a(l)+b(l,l+1)(1.1) a(l+

系統學習機器學習之神經網路（四） --SOM

轉自:http://blog.csdn.net/xbinworld/article/details/50818803，其實內容更多的是百度文庫裡叫《SOM自組織特徵對映神經網路》這篇文章上的，博主增加了一些理解。本文詳細介紹一下自組織神經網路概念和原理，並重點介紹一下自組

系統學習機器學習之神經網路（十二） --人工神經網路總結

本來這篇還缺個RBM，但RBM在DBN中使用，暫時放在深度學習那裡。這裡看到一篇非常好的總結，儲存下來。轉自：http://blog.csdn.net/fengbingchun/article/details/50274471 本文主要對人工神經網路基礎進行了描述，主要包

機器學習之神經網路bp演算法推導

這是一篇學習UFLDL反向傳導演算法的筆記，按自己的思路捋了一遍，有不對的地方請大家指點。首先說明一下神經網路的符號： 1. nl 表示神經網路的層數。 2. sl 表示第 l 層神經元個數，不包含偏置單元。 3. z(l)i 表示第 l 層第 i 個

機器學習之決策樹演算法python實現

一. 理論基礎 1. 特徵選擇 a. 資訊熵 H(D)=−∑i=0kpilogpi b. 條件熵 H(Y|X)=∑i=0npiH(Y|X=xi) c. 資訊增益 I(D,A)=H(D)−H(D|A) d. 資訊增益比

機器學習與神經網路（四）：BP神經網路的介紹和Python程式碼實現

前言：本篇博文主要介紹BP神經網路的相關知識，採用理論+程式碼實踐的方式，進行BP神經網路的學習。本文首先介紹BP神經網路的模型，然後介紹BP學習演算法，推導相關的數學公式，最後通過Python程式碼實現BP演算法，從而給讀者一個更加直觀的認識。 1.BP網路模型為了將理

機器學習與神經網路（二）：感知器的介紹和Python程式碼實現

前言：本篇博文主要介紹感知器的相關知識，採用理論+程式碼實踐的方式，進行感知器的學習。本文首先介紹感知器的模型，然後介紹感知器學習規則（Perceptron學習演算法），最後通過Python程式碼實現單層感知器，從而給讀者一個更加直觀的認識。 1.單層感知器模型單層感知器

神經網路學習（3）————BP神經網路以及python實現

一、BP神經網路結構模型 BP演算法的基本思想是，學習過程由訊號的正向傳播和誤差的反向傳播倆個過程組成，輸入從輸入層輸入，經隱層處理以後，傳向輸出層。如果輸出層的實際輸出和期望輸出不符合

神經網路學習（2）————線性神經網路以及python實現

一、線性神經網路結構模型在結構上與感知器非常相似，只是神經元啟用函式不同，結構如圖所示：若網路中包含多個神經元節點，就可形成多個輸出，這種神經網路可以用一種間接的方式解決線性不可分的問題，方法是用多個線性含糊對區域進行劃分，神經結構和解決異或問題如圖所示： &nbs

機器學習_3.神經網路之CNN

卷積神經網路卷積神經網路（Convoltional Neural Networks, CNN）是一類包含卷積或相關計算且具有深度結構的前饋神經網路（Feedforward Neural Networks），是深度學習（deep learning）的代表演算法之一

機器學習_2.神經網路之DBN

深度信念網路（DBN）深度信念網路是一個概率生成模型，與傳統的判別模型的神經網路相對，生成模型是建立一個觀察資料和標籤之間的聯合分佈，對P(Observation|Label)和 P(Label|Observation)都做了評估，而判別模型僅僅而已評估了後者，也就是P(Label|O

深度學習之(神經網路)單層感知器（python）（一）

感知器介紹感知器（Perceptron），是神經網路中的一個概念，在1950s由Frank Rosenblatt第一次引入。單層感知器（Single Layer Perceptron）是最簡單的神經網路。它包含輸入層和輸出層，而輸入層和輸出層是直接相連的。

機器學習之神經網路及python實現

相關推薦