1. 程式人生 > >機器學習之神經網路及python實現

機器學習之神經網路及python實現

神經網路在機器學習中有很大的應用,甚至涉及到方方面面。本文主要是簡單介紹一下神經網路的基本理論概念和推算。同時也會介紹一下神經網路在資料分類方面的應用。

首先,當我們建立一個迴歸和分類模型的時候,無論是用最小二乘法(OLS)還是最大似然值(MLE)都用來使得殘差達到最小。因此我們在建立模型的時候,都會有一個loss function。

而在神經網路裡也不例外,也有個類似的loss function。

對迴歸而言:

 

對分類而言:

 

然後同樣方法,對於W開始求導,求導為零就可以求出極值來。

關於式子中的W。我們在這裡以三層的神經網路為例。先介紹一下神經網路的相關引數。

 

第一層是輸入層,第二層是隱藏層,第三層是輸出層。

在X1,X2經過W1的加權後,達到隱藏層,然後經過W2的加權,到達輸出層

其中,

 

我們有:

 

至此,我們建立了一個初級的三層神經網路。

當我們要求其的loss function最小時,我們需要逆向來求,也就是所謂的backpropagation。

我們要分別對W1和W2進行求導,然後求出其極值。

從右手邊開始逆推,首先對W2進行求導。

代入損失函式公式:

 

 

然後,我們進行化簡:

 

化簡到這裡,我們同理再對W1進行求導。

 

我們可以發現當我們在做bp網路時候,有一個逆推回去的誤差項,其決定了loss function 的最終大小。

在實際的運算當中,我們會用到梯度求解,來求出極值點。

 

總結一下來說,我們使用向前推進來理順神經網路做到迴歸分類等模型。而向後推進來計算他的損失函式,使得引數W有一個最優解。

當然,和線性迴歸等模型相類似的是,我們也可以加上正則化的項來對W引數進行約束,以免使得模型的偏差太小,而導致在測試集的表現不佳。

 

Python 的實現:

使用了KERAS的庫

解決線性迴歸:

model.add(Dense(1, input_dim=n_features, activation='linear', use_bias=True))

# Use mean squared error for the loss metric and use the ADAM backprop algorithm
model.compile(loss='mean_squared_error', optimizer='adam') # Train the network (learn the weights) # We need to convert from DataFrame to NumpyArray history = model.fit(X_train.values, y_train.values, epochs=100, batch_size=1, verbose=2, validation_split=0)

解決多重分類問題:

# create model
model = Sequential()
model.add(Dense(64, activation='relu', input_dim=n_features))
model.add(Dropout(0.5))
model.add(Dense(64, activation='relu'))
model.add(Dropout(0.5))
# Softmax output layer
model.add(Dense(7, activation='softmax'))

model.compile(loss='categorical_crossentropy', optimizer='adam', metrics=['accuracy'])

model.fit(X_train.values, y_train.values, epochs=20, batch_size=16)

y_pred = model.predict(X_test.values)

y_te = np.argmax(y_test.values, axis = 1)
y_pr = np.argmax(y_pred, axis = 1)

print(np.unique(y_pr))

print(classification_report(y_te, y_pr))

print(confusion_matrix(y_te, y_pr))

當我們選取最優引數時候,有很多種解決的途徑。這裡就介紹一種是gridsearchcv的方法,這是一種暴力檢索的方法,遍歷所有的設定引數來求得最優引數。

from sklearn.model_selection import GridSearchCV

def create_model(optimizer='rmsprop'):
    model = Sequential()
    model.add(Dense(64, activation='relu', input_dim=n_features))
    model.add(Dropout(0.5))
    model.add(Dense(64, activation='relu'))
    model.add(Dropout(0.5))
    model.add(Dense(7, activation='softmax'))
    model.compile(loss='categorical_crossentropy', optimizer=optimizer, metrics=['accuracy'])
    
    return model

model = KerasClassifier(build_fn=create_model, verbose=0)

optimizers = ['rmsprop']
epochs = [5, 10, 15]
batches = [128]


param_grid = dict(optimizer=optimizers, epochs=epochs, batch_size=batches, verbose=['2'])
grid = GridSearchCV(estimator=model, param_grid=param_grid)

grid.fit(X_train.values, y_train.values)