tensorflow課堂筆記（六）神經網路搭建的八股

阿新 • • 發佈：2018-12-19

"""
神經網路搭建的八股：
前向傳播就是搭建網路，設計網路結構（forward.py）
def forward(x, regularizer):
    w=
    b=
    y=
    return y

def get_weight(shape, regularizer):
    w=tf.Variable()
    tf.add_to_collection('losses', tf.contrib.layers.l2_regularizer(regularizer(w))
    return w

def get_bias(shape):
    b=tf.Variable()
    return b

反向傳播就是訓練網路，優化網路引數（backwaor.py）
def backward():
    x=tf.placehlder()
    y_=tf.placeholder()
    y=forward.forward(x, REGULARIZER)
    global_step=tf.Variable(0, trainable=False)
    loss=

loss可以是：
y與y_的差距=tf.reduce_mean(tf.square(y-y_))
也可以是：
ce=tf.nn.sparse_softmax_cross_entropy_with_logits(logits=y, labels=tf.argmax(y_, 1))
y與y_的差距（cem）=tf.reduce_mean(ce)
加入正則化後：
loss=y與y_的差距+tf.add_n(tf.get_collection('losses'))

指數衰減學習率
learning_rate=tf.train.exponential_decay(
    LEARNING_RATE_BASE,
    global_step,
    資料集總樣本數/BATCH_SIZE,
    LEARNING_RATE_DECAY,
    staircase=True)
train_step=tf.train.GrandientDescentOptimizer(learning_rate).minimize(loss,global_step=global_step)

滑動平均
ema=tf.train.ExponentialMovingAverage(MOVING_AVERAGE_DECAY,gloabl_step)
ema_op=ema.apply(tf.trainable_variables())
with tf.control_dependencies([train_step, ema_op]):
    train_op=tf.no_op(name='train')

with tf.Session() as sess:
    init_op=tf.global_variable_initializer()
    sess.run(init_op)

    for i in range(STEPS):
        sess.run(train_step, feed_dict={x: ,y_: })
        if i % 輪數 == 0:
        print

if __name__ == '__main__':
    backward()
"""

generateds.py 生成資料集

#coding:utf-8
#0匯入模組，生成模擬資料集
import numpy as np
import matplotlib.pyplot as plt
seed = 2
#param X 正態分佈資料集 ， 2列
#param Y_ 根據X判斷是否在圓中，是為1，不是為0
#param Y_c 將圓內點變成紅色，圓外點變成藍色
def generateds():
    #基於seed產生隨機數
    rdm = np.random.RandomState(seed)
    #隨機數返回300行2列的矩陣
    X = rdm.randn(300, 2)   #randn表示正態分佈
    #取出每一行分析Y_的取值
    Y_ = [int(x0*x0 + x1*x1 < 2) for [x0, x1] in X]
    #在圓內的點為紅色，圓外的點為藍色
    Y_c = [['red' if y else 'blue'] for y in Y_]
    #對資料集X和標籤Y進行形狀整理，第一個維度根據第二個維度進行計算
    X = np.vstack(X).reshape(-1, 2)
    Y_ =np.vstack(Y_).reshape(-1, 1)   #Y_原來只有一行很多列，現在變成多行一列
    print(X)
    return X, Y_, Y_c

forward.py 前向傳播

#coding:utf-8
#0匯入模組，生成模擬資料集
import tensorflow as tf

#定義神經網路的輸入，引數的輸出，定義前向傳播過程
def get_weight(shape, regularizer):
    w = tf.Variable(tf.random_normal(shape, dtype=tf.float32))#正態分佈的變數
    tf.add_to_collection('losses', tf.contrib.layers.l2_regularizer(regularizer)(w))
    return w

def get_bias(shape):
    b = tf.Variable(tf.constant(0.01, shape=shape))
    return b
#在這裡設計了神經網路結構
#輸出層-》隱藏層-》輸出層，其中隱藏層有11個結點
def forward(x, regularizer):
    w1 = get_weight([2, 11], regularizer)   #2行11列的w，隱藏層有11個結點
    b1 = get_bias([11])                     #每一個w都要有一個偏置
    y1 = tf.nn.relu(tf.matmul(x, w1) + b1)  #得到1行11列向量

    w2 = get_weight([11, 1], regularizer)   #輸出層的權重
    b2 = get_bias([1])                      #輸出層偏置
    y = tf.matmul(y1, w2) + b2              #輸出結果
    return y

backward.py 反向傳播

#coding:utf-8
#0匯入模組，生成模擬資料集
import tensorflow as tf
import numpy as np
import matplotlib.pyplot as plt
import generagteds
import forward

STEPS = 40000
BATCH_SIZE = 30
LEARNING_RATE_BASE = 0.001  #初始的學習率
LEARNING_RATE_DECAY = 0.999 #指數衰減學習率中的衰減率
REGULARIZER = 0.01          #正則化引數
"""
指數衰減學習率
learning_rate = LEARNING_RATE_BASE*(LEARNING_RATE_DECAY)^\
                (global_step/decay_step),\
                其中 decay_step=sample_size/BATCH_SIZE
"""
def backward():
    x = tf.placeholder(tf.float32, shape=[None, 2])
    y_ = tf.placeholder(tf.float32, shape=[None, 1])
    X, Y_, Y_c = generagteds.generateds()
    y = forward.forward(x, REGULARIZER)    #前向傳播後得到的結果
    global_step = tf.Variable(0, trainable=False)  #初始值為0且不可訓練
    learning_rate = tf.train.exponential_decay(
        LEARNING_RATE_BASE,
        global_step,
        300/BATCH_SIZE,
        LEARNING_RATE_DECAY,
        staircase=True
    )

    #定義損失函式
    loss_mse = tf.reduce_mean(tf.square(y-y_))
    loss_total = loss_mse + tf.add_n(tf.get_collection('losses'))
    """
    tf.add_to_collection 向當前計算圖中新增張量集合
    tf.get_collection 返回當前計算圖中手動新增的張量集合
    tf.add_n 實現兩個列表對應元素的相加
    """

    #定義反向傳播方法：包含正則化
    train_step = tf.train.AdamOptimizer(learning_rate).minimize(loss_total)

    with tf.Session() as sess:
        init_op = tf.global_variables_initializer()
        sess.run(init_op)
        for i in range(STEPS):
            start = (i % BATCH_SIZE) % 300
            end = start + BATCH_SIZE
            sess.run(train_step, feed_dict={x: X[start:end], y_ : Y_[start:end]})
            if i % 2000 == 0:
                loss_v = sess.run(loss_total,feed_dict={x:X, y_:Y_})
                print("After %d steps, loss is : %f"%(i, loss_v))

        xx, yy = np.mgrid[-3:3:.01, -3:3:.01]           #xx/yy.shape=(600,600)
        grid = np.c_[xx.ravel(), yy.ravel()]            #grid.shape=(360000,2)
        probs = sess.run(y, feed_dict={x:grid})         #y是前向傳播得到的結果
        probs = probs.reshape(xx.shape)                 #probs.shape=(600,600)

    plt.scatter(X[:,0], X[:,1], c=np.squeeze(Y_c))      #scatter表示散點圖，c表示color
    plt.contour(xx, yy, probs, levels=[.5])             #畫出等高線(x,y,f(x,y),)
    plt.show()

if __name__=='__main__':
    backward()

輸出結果：

After 0 steps, loss is : 22.403366
After 2000 steps, loss is : 0.388432
After 4000 steps, loss is : 0.220161
After 6000 steps, loss is : 0.178859
After 8000 steps, loss is : 0.149793
After 10000 steps, loss is : 0.135582
After 12000 steps, loss is : 0.128238
After 14000 steps, loss is : 0.122058
After 16000 steps, loss is : 0.121162
After 18000 steps, loss is : 0.121859
After 20000 steps, loss is : 0.117058
After 22000 steps, loss is : 0.116621
After 24000 steps, loss is : 0.118317
After 26000 steps, loss is : 0.115774
After 28000 steps, loss is : 0.115856
After 30000 steps, loss is : 0.117945
After 32000 steps, loss is : 0.115462
After 34000 steps, loss is : 0.115636
After 36000 steps, loss is : 0.117573
After 38000 steps, loss is : 0.115184

tensorflow課堂筆記（六）神經網路搭建的八股

""" 神經網路搭建的八股：前向傳播就是搭建網路，設計網路結構（forward.py） def forward(x, regularizer): w= b= y= return y def get_weight(shape, regular

機器學習筆記（六）神經網路引入及多分類問題實踐

一、神經網路引入我們將從計算機視覺直觀的問題入手，提出引入非線性分類器的必要性。首先，我們希望計算機能夠識別圖片中的車。顯然，這個問題對於計算機來說是很困難的，因為它只能看到畫素點的數值。應用機器學習，我們需要做的就是提供大量帶標籤的圖片作為訓練集，有的圖片是一輛車，有的圖片不是一輛車，最終我們

tensorflow課堂筆記（三）

損失函式 """ 神經元模型 f(∑xiwi + b)，其中b為偏置項bias，f為啟用函式activation function 啟用函式 activation function tf.nn.relu() tf.nn.sigmoid() tf.nn.tanh() NN的複雜度層數 = 隱藏層

tensorflow課堂筆記（二）

#coding utf-8 """ 反向傳播-》訓練模型引數，在所有引數上用梯度下降，使NN模型在訓練資料上的損失函式最小損失函式（loss）：預測值（y）與已知答案（y_）的差距均方誤差MSE : MSE(Y_,Y)=(Y-Y_)^2求算術平均值 loss = tf.reduce_mean(t

深度學習筆記（四）——神經網路和深度學習（淺層神經網路）

1.神經網路概覽神經網路的結構與邏輯迴歸類似，只是神經網路的層數比邏輯迴歸多一層，多出來的中間那層稱為隱藏層或中間層。從計算上來說，神經網路的正向傳播和反向傳播過程只是比邏輯迴歸多了一次重複的計算。正向傳播過程分成兩層，第一層是輸入層到隱藏層，用上標[1]來表示；第二層是隱藏層到輸出層，用上標

吳恩達深度學習筆記（3）-神經網路如何實現監督學習？

神經網路的監督學習(Supervised Learning with Neural Networks) 關於神經網路也有很多的種類，考慮到它們的使用效果，有些使用起來恰到好處，但事實表明，到目前幾乎所有由神經網路創造的經濟價值，本質上都離不開一種叫做監督學習的機器學習類別，讓我們舉例看看。

吳恩達機器學習筆記（5）—— 神經網路

本教程將教大家如何快速簡單的搭起一個自己的部落格，並不會系統的教會你如何建站，但是可以讓掌握建站的基礎對以後web學習有一定的幫助。購買一個域名域名就相當於地址，我們就是通過域名來訪問我們的網站，現在萬網和騰訊雲都有廉價域名賣，首年大概1-5元一年吧。

# [cs231n （六）神經網路 part 2:傳入資料和損失 ][1]

標籤（空格分隔）：神經網路 0.回顧 cs231n （一）影象分類識別講了KNN cs231n （二）講了線性分類器：SVM和SoftMax cs231n （三）優化問題及方法 cs231n （四）反向傳播 cs231n （五）神經網路（part 1）

TensorFlow學習筆記（六）—— MNIST —— 入門

MNIST機器學習入門這個教程的目標讀者是對機器學習和TensorFlow都不太瞭解的新手。如果你已經瞭解MNIST和softmax迴歸(softmax regression)的相關知識，你可以閱讀這個快速上手教程。當我們開始學習程式設計的時候，第一件事往往是學習列印

cs231n斯坦福基於卷積神經網路的CV學習筆記（二）神經網路訓練細節

五，神經網路注意點part1 例項：邏輯迴歸二層神經網路訓練函式使用權重w和偏差值biase計算出第一個隱含層h，然後計算損失，評分，進行反向傳播回去多種常用啟用函式（一般預設max（0，x）），如sigmoid函式具有飽和區梯度0，非零點中心，計算x複

tensorflow課堂筆記（四）

學習率 """ 學習率 learning_rate：每次引數更新的幅度 wn+1 = wn - learning_rate▽ 相當於每次在梯度反方向減少的幅度，因為梯度是增加最大的方向，我們要找到極小值我們優化引數的目的就是讓loss損失函式最小，所以每次都減少一點梯度方

機器學習（西瓜書）學習筆記（四）---------神經網路

1. 神經元模型神經網路/人工神經網路：由具有適應性的簡單單元組成的廣泛並行互連的網路。神經網路學習：機器學習和神經網路兩個學科交叉的部分。 Neural Networks中的基本單元：神經元。從電腦科學的角度，NN就是一個包含了大量引數的數學模型，該模型由若干個函式相互代入而

2017CS231n李飛飛深度視覺識別筆記（四）——神經網路

第四講神經網路課時1 反向傳播目前，我們已經講了怎麼定義一個分類器、怎麼定義一個損失函式以及它的正則化，也討論了用梯度下降的方法找到最小化的損失函式。接下來，將討論如何計算任意複雜函式

機器學習筆記（七）神經網路

神經網路神經網路神經元模型感知機與多層網路多層前饋神經網路（multi-layer feedforward neural networks）誤差逆傳播（error BackPropagation

Coursera吳恩達《神經網路與深度學習》課程筆記（2）-- 神經網路基礎之邏輯迴歸

上節課我們主要對深度學習（Deep Learning）的概念做了簡要的概述。我們先從房價預測的例子出發，建立了標準的神經網路（Neural Network）模型結構。然後從監督式學習入手，介紹了Standard NN，CNN和RNN三種不同的神經網路模型。接

斯坦福cs231n學習筆記（11）------神經網路訓練細節（梯度下降演算法大總結/SGD/Momentum/AdaGrad/RMSProp/Adam/牛頓法）

神經網路訓練細節系列筆記：通過學習，我們知道，因為訓練神經網路有個過程: <1>Sample 獲得一批資料； <2>Forward 通過計算圖前向傳播，獲得loss； <3>Backprop 反向傳播計算梯度，這

google機器學習框架tensorflow學習筆記（六）

使用Tensorflow的基本步驟設定首先載入必要的庫 import math from IPython import display from matplotlib import cm from matplotlib import gridspec fr

UFLDL 教程學習筆記（一）神經網路

UFLDL（Unsupervised Feature Learning and Deep Learning）Tutorial 是由 Stanford 大學的 Andrew Ng 教授及其團隊

scikit-leran學習筆記（3）---神經網路模型（有監督的）

1.Multi-layer Perceptron 多層感知機 MLP是一個監督學習演算法，圖1是帶一個隱藏層的MLP模型左邊層是輸入層，由神經元集合{xi|x1,x2,…,xm},代表輸入特徵，隱藏層的每個神經元將前一層的的值通過線性加權求

周志華《Machine Learning》學習筆記（6）--神經網路

上篇主要討論了決策樹演算法。首先從決策樹的基本概念出發，引出決策樹基於樹形結構進行決策，進一步介紹了構造決策樹的遞迴流程以及其遞迴終止條件，在遞迴的過程中，劃分屬性的選擇起到了關鍵作用，因此緊接著討論了三種評估屬性劃分效果的經典演算法，介紹了剪枝策略來解決原生決

tensorflow課堂筆記（六）神經網路搭建的八股

相關推薦