TensorFlow實戰（五）- 使用TensorFlow實現多層感知機

阿新 • • 發佈：2019-01-26

一，多層感知機簡介

多層感知機也叫深度前饋網路或前饋神經網路。

“多層”本質上指的是多層隱含層，神經網路的非線性也主要體現在隱含層非線性的啟用函式上，理論上只要隱含節點足夠多，只要有一層隱含層就可以擬合任意函式，但隱含層越多，就越容易擬合複雜函式，並且所需的隱含單元也越少。

但是，層數較深的神經網路會出現很多問題：

過擬合
引數難以除錯
梯度消失
等等

解決方法有：

1，Dropout解決過擬合問題

過擬合：神經網路的引數一般都很多，經常會出現引數比資料還要多的情況，所以過擬合很容易出現。
Dropout：主要思想是在訓練時，將神經網路某些層的輸出節點資料隨機丟棄一部分，這種做法本質上等於創造了很多新的隨機的樣本，通過增大樣本量、減少特徵數量來防止過擬合。

一般來說對越複雜越大的神經網路，dropout的效果越顯著。

2，自適應學習率演算法減輕除錯引數的負擔

引數難以除錯：主要是因為SGD的受學習速率的設定影響很大；神經網路通常不是一個凸優化問題，處處充分區域性最優；但有理論表明，神經網路可能有很多區域性最優解都可以達到比較好的分類效果，而全域性最優反而容易是過擬合的解。
自適應學習率演算法：這種演算法通常會隨著訓練輪數的增加而不斷調整學習速率，從而使加速收斂並且最終穩定地落入到一個區域性最優解中。常用的演算法有Adagrad、Adam、Adadelta等等。

3，Relu啟用函式解決梯度消失問題

梯度消失：當神經網路層數較多時，一些啟用函式如sigmoid啟用函式在誤差反向傳播中梯度值會逐漸減小，經過多層的傳遞後會呈指數級急劇減小，因此梯度值在傳遞到前面幾層時會變得非常小，小到無法更新神經網路的引數，起不到訓練的作用。

Relu啟用函式： $y = m a x (0, x)$ ，類似人腦的閾值響應機制，由於右側是線性的，梯度值不會變，所以不會出現梯度消失的問題。
特點有三：
①單側抑制。
②相對寬闊的興奮邊界。
③稀疏啟用性。
神經元編碼的工作方式具有稀疏性，即大腦同時被啟用的神經元只有1%~4%，而sigmoid啟用函式會啟用幾乎一般的神經元嗎，不符合神經科學的研究。
Softplus雖然單側抑制，但是不具有稀疏啟用性，因而Relu及其變體(EIU、PRelu、RRelu、maxout等)成了最符合實際神經元也最流行的啟用函式，它們可以帶來訓練速度和模型準確率的提升，但是輸出層一般還是使用sigmoid或softmax啟用函式，因為它們最接近概率輸出分佈。

二，用TensorFlow實現MLP

實現中用到了

Dropout
自適應學習率演算法Adagrad
Relu啟用函式

一些基礎

tf.nn.dropout(h1,keep_prob)
tf.truncated_normal(shape,stddev)
tf.train.AdagradOptimizer()
之所以將W1初始化為截斷的正態分佈，是因為隱含層使用了Relu啟用函式，所以需要正態分佈給引數加一點噪聲，來打破完全對稱並且避免0梯度。在其他一些模型中，有時還需要給偏置賦上一些小的非零值來避免死亡神經元。而W2和b2直接賦值為0，是因為softmax啟用函式在0附近最敏感、梯度最大。

tensorflow的實現

# 多層感知機的實現
import tensorflow as tf
from tensorflow.examples.tutorials.mnist import input_data

# 0，匯入資料
mnist = input_data.read_data_sets("MNIST_data/",one_hot=True)
print(mnist.train.images.shape,mnist.train.labels.shape)

# 1，定義模型計算公式
sess = tf.InteractiveSession()
in_units = 784
h1_units = 300
W1 = tf.Variable(tf.truncated_normal([in_units,h1_units],stddev=0.1))
b1 = tf.Variable(tf.zeros([h1_units]))
W2 = tf.Variable(tf.zeros([h1_units,10]))
b2 = tf.Variable(tf.zeros([10]))

X = tf.placeholder(tf.float32,[None,in_units])
keep_prob = tf.placeholder(tf.float32,)
h1 = tf.nn.relu(tf.matmul(X,W1)+b1)
h1_drop = tf.nn.dropout(h1,keep_prob)
y_pred = tf.nn.softmax(tf.matmul(h1_drop,W2)+b2)


# 2,定義loss，選定優化器
y = tf.placeholder(tf.float32,[None,10])
cross_entropy = tf.reduce_mean(-tf.reduce_sum(y*tf.log(y_pred),reduction_indices=[1]))
train_step = tf.train.AdagradOptimizer(learning_rate=0.3).minimize(cross_entropy)

# 3,定義精確度計算公式
correct_prediction = tf.equal(tf.argmax(y_pred,1),tf.argmax(y,1))
accuracy = tf.reduce_mean(tf.cast(correct_prediction,tf.float32))

# 4,初始化引數
tf.global_variables_initializer().run()

# 4,迭代訓練
epoch_num = 1
for epoch in range(epoch_num):
    avg_accuracy = 0.0
    avg_cost = 0.0
    for i in range(3000):
        batch_xs,batch_ys = mnist.train.next_batch(100)
        cost,acc,_ = sess.run([cross_entropy,accuracy,train_step],feed_dict={X:batch_xs,y:batch_ys,keep_prob:0.75})
        avg_cost += cost
        avg_accuracy += acc/3000
    print('Epoch %d: cost is %.7f,accuracy is %.7f.'%(epoch+1,avg_cost,avg_accuracy))
print('Train Finished!')
print('Test accuracy is %.4f.'%accuracy.eval({X:mnist.test.images,y:mnist.test.labels,keep_prob:1.0}))

# 5,Get one and predict
import matplotlib.pyplot as plt
import random
r = random.randint(0, mnist.test.num_examples - 1)
print("Label:", sess.run(tf.argmax(mnist.test.labels[r:r+1], 1)))
print("Prediction:", sess.run(tf.argmax(y_pred, 1),feed_dict={X: mnist.test.images[r:r + 1],keep_prob:1.0}))
plt.imshow(mnist.test.images[r:r + 1].reshape(28, 28), cmap='Greys', interpolation='nearest')
plt.show()

sess.close()

執行結果

Deeplearning4j 實戰（5）：基於多層感知機的Mnist壓縮以及在Spark實現

在上一篇部落格中，我們用基於RBM的的Deep AutoEncoder對Mnist資料集進行壓縮，應該說取得了不錯的效果。這裡，我們將神經網路這塊替換成傳統的全連線的前饋神經網路對Mnist資料集進行壓縮，看看兩者的效果有什麼異同。整個程式碼依然是利用Deeplearning4j進行實現，並且為了方

深度學習Deeplearning4j 入門實戰（5）：基於多層感知機的Mnist壓縮以及在Spark實現

在上一篇部落格中，我們用基於RBM的的Deep AutoEncoder對Mnist資料集進行壓縮，應該說取得了不錯的效果。這裡，我們將神經網路這塊替換成傳統的全連線的前饋神經網路對Mnist資料集進行壓縮，看看兩者的效果有什麼異同。整個程式碼依然是利用Deeplearnin

TensorFlow實戰（五）- 使用TensorFlow實現多層感知機

一，多層感知機簡介多層感知機也叫深度前饋網路或前饋神經網路。 “多層”本質上指的是多層隱含層，神經網路的非線性也主要體現在隱含層非線性的啟用函式上，理論上只要隱含節點足夠多，只要有一層隱含層就可以擬合任意函式，但隱含層越多，就越容易擬合複雜函式，並且

Tensorflow實戰（五）經典卷積神經網路之實現VGGNet

演算法原理： VGGNet探索了卷積神經網路深度與其效能之間的關係，通過反覆的堆疊3*3的小型卷積核和2*2的最大池化層，VGGNet成功的構建了16-19層深的卷積神經網路。。 VGGNet擁有5段卷積，每一段內有2-3個卷積層，同時尾部會連線一

TensorFlow實戰（五）——交通標誌牌（GTSRB資料集）的格式轉換（二）

前言：在上一篇部落格學習瞭如何將資料集轉換成jpg檔案，本文介紹如何將資料集轉換為png的格式，以及如何將資料資訊儲存在csv檔案中，實現程式碼比上編部落格有所改進。一、格式轉換我的訓練資料集儲存路徑如下：隨意進入一個資料夾，可以看到：來看看測

TensorFlow學習筆記（4）--實現多層感知機（MNIST資料集）

前面使用TensorFlow實現一個完整的Softmax Regression，並在MNIST資料及上取得了約92%的正確率。現在建含一個隱層的神經網路模型（多層感知機）。 import tensorflow as tf import numpy as np

TensorFlow 實戰（五）—— 影象預處理

當然 tensorflow 並不是一種用於影象處理的框架，這裡影象處理僅僅是一些簡單的畫素級操作，最終目的比如用於資料增強； tf.random_crop() tf.image.random_fli

用pytorch實現多層感知機（MLP)（全連線神經網路FC）分類MNIST手寫數字體的識別

1.匯入必備的包 1 import torch 2 import numpy as np 3 from torchvision.datasets import mnist 4 from torch import nn 5 from torch.autograd import Variable 6

tensorflow實現多層感知機進行手寫字識別

logits=multilayer_perceptron(X) #使用交叉熵損失 loss_op=tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits(logits=logits,labels=Y))

Keras簡單實現多層感知機（MLP）程式碼

import keras from keras.model import Sequential from keras.layers import Dense,Dropout from keras.op

tensorflow實現多層感知機

在前面的部落格中我們已經討論過softmax實現分類的例子，該模型最大的特點是簡單易用，但是擬合能力不強。它和傳統意義上的神經網路的最大區別是沒有隱含層。對於神經網路來說，引入非線性隱含層後，理論上只要隱含節點足夠多，即使只有一個隱含層的神經網路也可以擬合任

gluon 實現多層感知機MLP分類FashionMNIST

from mxnet import gluon,init from mxnet.gluon import loss as gloss, nn from mxnet.gluon import data as gdata from mxnet import nd,autograd import gl

TensorFlow入門（五）多層 LSTM 通俗易懂版

歡迎轉載，但請務必註明原文出處及作者資訊。 @author: huangyongye @creat_date: 2017-03-09 前言: 根據我本人學習 TensorFlow 實現 LSTM 的經歷，發現網上雖然也有不少教程，其中很多都是根據官方

神經網路之多層感知機MLP的實現（Python+TensorFlow）

用 MLP 實現簡單的MNIST資料集識別。 # -*- coding:utf-8 -*- # # MLP """ MNIST classifier, 多層感知機實現 """ # Import

【tensorflow】TensorFlow入門（五）多層 LSTM 通俗易懂版

前言: 根據我本人學習 TensorFlow 實現 LSTM 的經歷，發現網上雖然也有不少教程，其中很多都是根據官方給出的例子，用多層 LSTM 來實現 PTBModel 語言模型，比如： tensorflow筆記：多層LSTM程式碼分析但是感覺這些例子還是太複雜了

Tensorflow 實戰Google深度學習框架——學習筆記（五）TensorFlow持久化

TensorFlow模型持久化模型持久化的目的：為了讓訓練完的模型可以在下次使用 TensorFlow提供了一個非常簡單的API來儲存和還原一個神經網路，這個API類就是tf.train.Saver類。以下是儲存TensorFlow計算圖的方法。變數

TensorFlow 實戰（二）—— tf train（優化演算法）

分享一下我老師大神的人工智慧教程！零基礎，通俗易懂！http://blog.csdn.net/jiangjunshow 也歡迎大家轉載本篇文章。分享知識，造福人民，實現我們中華民族偉大復興！

TensorFlow 學習（五）二分類logistic迴歸模型

邏輯迴歸的損失函式是對數損失函式，對數損失函式的方程式與資訊理論中的熵測量密切相關。它也是似然函式的負對數（假設“y‘ ’” 屬於伯努利分佈）。實際上，最大限度地降低損失函式的值會生成最大的似然估計值。對數損失函式的方程式如下圖

Mybatis（攔截器實現）通用mapper及全ORM實現（五）-- springboot+mybatis多資料來源設定

本篇實際上和mybatisext專案並沒有太大關係了，但在實際專案中脫離不開多個數據源，尤其是主從分離，同樣網上一些資料大同小異而且大部分並不能真正解決問題，所以單獨提出來說一下假設我們就是要解決一個主從分離，資料來源定義在了application.properties中

Tensorflow框架（五）

本章是對前五章的總結一、概述 Tensorflow框架的核心概念是計算圖：整個計算流圖的主要包含以下幾個部分：匯入資料網路結構損失函式反向傳播由於Tensorflow框架的機制，反向傳播過程並不需要我

TensorFlow實戰（五）- 使用TensorFlow實現多層感知機

一，多層感知機簡介

二，用TensorFlow實現MLP

相關推薦