TensorFlow入門--Chapter02

阿新 • • 發佈：2018-12-09

深層神經網路

1 深層神經網路

1.1 深度學習基本概念

維基百科定義：一類通過多層非線性變換對高複雜性資料建模演算法的集合
兩個重要特性：多層和 非線性

1.2 線性模型的侷限性

線性模型的最大特點是任意線性模型的組合任然是線性模型
一個線性模型通過輸入得到輸出的函式被稱為一個線性變換

缺點：由於現實中的問題往往不具有線性，因此線性模型解決的問題具有侷限性

1.3 使用啟用函式去線性化

chapter01 介紹的神經網路是一個線性模型，原因是對神經元結構的輸出為所有輸入的加權和，線性模型具有侷限性

解決：如果將每個神經元的輸出通過一個非線性函式（啟用函式），那麼整個神經網路就是非線性的了，去線性化前後對比程式碼如下：

#只展示部分程式碼
#去線性化之前
#random_normal生成隨機的符合正態分佈且 方差為1（stddev=1） 的 2x3陣列
w1 = tf.Variable(tf.random_normal([2, 3],stddev=1, seed=1))
w2 = tf.Variable(tf.random_normal([3, 1],stddev=1, seed=1))
x = tf.placeholder(tf.float32, shape=(1, 2), name="input")
a = tf.matmul(x,w1)
y = tf.matmul(a,w2)

#去線性化之後
a = 
 tf.nn.relu(tf.matmul(x, w1) + biases1)
y = tf.nn.relu(tf.matmul(x, w2) + biases2)

常見啟用函式

函式名	函式作用
tf.nn.relu	relu函式的定義:f(x)=max(x,0)，x<0時，輸出始終為0。x>0時，導數為1
tf.sigmoid	可以將整個實數區間對映到(0,1)區間
tf.tanh	tanh是雙曲正切函式，它將整個實數區間對映到了(-1,1)，anh的收斂速度比sigmoid快

2 損失函式定義

神經網路模型的效果和優化的目標都是通過 損失函式 來定義的

2.1 經典損失函式

分類問題和迴歸問題是監督學習的兩大種類

分類問題：解決的是將不同的樣本分到事先定義好的類別中

損失函式：交叉熵（刻畫了連個概率分佈之間的距離，分類問題中經常用）
Softmax迴歸：交叉熵刻畫的是概率分佈之間的距離，然而神經網路輸出並不一定是概率分佈，概率分佈刻畫的是不同事件發生的概率，Softmax將神經網路的輸出變成一個概率分佈。

此時便可用交叉熵計算預測和真實的概率分佈之間的距離了。

#沒softmax迴歸的交叉熵損失函式
#tf.clip_by_value(A, min, max)：張量A，A中元素的值都壓縮在min和max之間。小於min的讓它等於min，大於max的元素的值等於max
cross_entropy = -tf.reduce_mean(y_ * tf.log(tf.clip_by_value(y, 1e-10, 1.0)))

交叉熵和Softmax迴歸
因為經常交叉熵和softmax一起使用，所以TensorFlow對這兩個功能進行了封裝，tf.nn.sotfmax_cross_entropy_with_logits()函式即softmax迴歸後的交叉熵損失函式

#labels代表是真實值，logist代表是預測值（神經網路輸出的結果）
cross_entropy = tf.nn.sotfmax_cross_entropy_with_logits(labels=y_, logist = y)
#在只有一個正確答案的時候，可以用tf.nn.sparse_softmax_cross_entropy_with_logits函式加速計算

迴歸問題：對具體數值的預測，要預測的不是事先定義好的類別，而是一個任意實數

損失函式：最常用的就是均方誤差(MSE)

#y代表神經網路輸出答案，y_代表標準答案
mse = tf.reduce_mean(tf.square(y_ - y))

2.2 自定義損失函式

引入：在預測商品銷售時，如果預測多了,即預測值大於真實值，則會使商家虧生產商品的成本，如果預測少了，即預測值小於真實值，則會使商家少掙很多利潤。假如成本為1元，利潤為10元，多預測一個虧1元，少預測一個少掙10元。
如果神經網路最小化的是均值誤差，那麼有可能此模型無法最大化利潤，為了最大化利潤可以將損失函式和利潤聯絡起來

依據上面引入

定義損失函式
預測值>真實值與預測值<真實值有不同的損失函式
$Loss(y,y')=\sum_{i=1}^Nf(y_i,y_i')$ , $f(x,y) = \begin{cases} a(x-y) & x>y \\b(y-x) & x\leq y \end{cases}$

與均值方差類似： $y_i$ 為一個batch中第i個數據的正確答案， $y_i'$ 為神經網路得到的預測值，a=10代表 $y_i >y_i'$ 的代價，b=1代表 $y_i<y_i'$ 的代價
通過對這個自定義損失函式的優化，模型提供的預測值可能達到最大收益。

#tf.where函式類似C語言中的三目運算子 : ?,引數一為true時選第二個引數false選第三個
#tf.greater(v1,v2),比較v1和v2的值，v1>v2返回true否則false，v1,v2是張量

loss = tf.reduce_sum(tf.where(tf.greater(v1,v2), (v1-v2)*a, (v2-v1)*b))

#案例
import tensorflow as tf
v1 = tf.constant([1.0,2.0,3.0,4.0])
v2 = tf.constant([4.0,3.0,2.0,1.0])
sess = tf.InteractiveSession()
print(tf.greater(v1, v2).eval())
## 輸出：[False False  True  True]
print(tf.where(tf.greater(v1,v2),v1,v2).eval())
## 輸出：[4. 3. 3. 4.]

損失函式對訓練結果的影響

#損失函式對模型的影響
import tensorflow as tf
from numpy.random import RandomState

#定義batch的大小
batch_size = 8

#兩個輸入節點
x = tf.placeholder(tf.float32, shape=(None, 2), name='x-input')

#迴歸問題一般只有一個輸出節點
y_ = tf.placeholder(tf.float32, shape=(None, 1), name='y-input')

#定義了一個單層的神經網路前向傳播的過程，這裡就是簡單的加權和
w1 = tf.Variable(tf.random_normal([2,1], stddev=1, seed=1))
y = tf.matmul(x, w1)

#定義預測多了和預測少了的成本
loss_less = 10
loss_more = 1
loss = tf.reduce_sum(tf.where(tf.greater(y, y_),(y-y_)*loss_more,(y_-y)*loss_less))
train_step = tf.train.AdamOptimizer(0.001).minimize(loss)

#通過隨機數生成一個模擬資料集
rdm = RandomState(1)
dataset_size = 128
X = rdm.rand(dataset_size, 2)

#設定真實值，為兩個輸入的和加上一個隨機量（為了加入不可預測的噪音）否則不同損失函式意義不大， 噪音一般均值為0的小量，這裡設定為-0.05~0.05
Y = [[x1 + x2 + rdm.rand()/10.0 - 0.05] for(x1, x2) in X]

#訓練神經網路
with tf.Session() as sess:
    init = tf.global_variables_initializer()
    sess.run(init)
    for i in range(5000):
        #每次選一個batch的資料量來訓練
        start = (i*batch_size) % dataset_size
        end = min(start+batch_size, dataset_size) #start和end之間相差一個batch
        #訓練
        sess.run(train_step, feed_dict={x: X[start:end], y_:Y[start:end]})
        print(sess.run(w1))

輸出結果：

2.3 神經網路優化演算法

梯度下降演算法：不能保證優化的函式達到全域性最優解
隨機梯度下降演算法：可能無法達到區域性最優
這個演算法的優化不是全部的資料集上的損失函式，而是在每一次的迭代過程中，隨機優化某一條資料上的損失函式
batch：為了綜合梯度下降和隨機梯度下降演算法，採用折中辦法，每次集散一小部分訓練資料的損失函式，這一小部分被稱為一個batch

TensorFlow入門--Chapter02

深層神經網路 1 深層神經網路 1.1 深度學習基本概念維基百科定義：一類通過多層非線性變換對高複雜性資料建模演算法的集合兩個重要特性：多層和非線性 1.2 線性模型的侷限性線性模型的最大特點是任意線性模型的組合任然是線性模型一個線性

TensorFlow入門：mac 安裝 TensorFlow

sse ssi 來安 pan lan bin pat ont world 開發環境： mac os 10.12.5 Python 2.7.10 GCC 4.2.1 mac默認是不帶pip的，安裝pip。 sudo easy_install pip 1.安裝vir

TensorFlow入門：安裝常用的依賴模塊

包含 librosa 任務 nltk plot orf 入門 learn sci TensorFlow運行中常用到一些Python第三方模塊： numpy 存儲和處理大型矩陣的科學計算包 maplotlib 最著名的繪圖庫 jupyter scikit-image 圖像預

TensorFlow入門

imp 我們 class rank node strong ima orf 運行 Tensor(張量)是TensorFlow中最核心的數據結構單元，ta它可以表示任意維數的數組。wei‘du維度用rank(秩)表示。例如： 3

TensorFlow文檔翻譯-01-TensorFlow入門

left https 你是但是 sam return 很多等級 license TensorFlow入門這是關於如何開始tensorFlow的指南。開始之前，你需要先安裝TensorFlow。除此之外，你應該了解：知道如何使用Python編程。懂一點點數組如

【tensorflow:Google】三、tensorflow入門

als 管理神經網絡等價問題 sign ria init 節點【一】計算圖模型節點是計算，邊是數據流， a = tf.constant( [1., 2.] )定義的是節點，節點有屬性 a.graph 取得默認計算圖　　g1 = tf.get_default_gr

tensorflow入門（一)

統一 .sh 函數 soft acf layers 估計一個地方 aid 轉載：作者：地球的外星人君鏈接：https://www.zhihu.com/question/49909565/answer/207609620來源：知乎著作權歸作者所有。商業轉載請聯系作者獲得授權

轉：TensorFlow入門（六）雙端 LSTM 實現序列標註（分詞）

vsm max poc 代碼單詞 arch 大致雙端 fun http://blog.csdn.net/Jerr__y/article/details/70471066 歡迎轉載，但請務必註明原文出處及作者信息。 @author: huangyongye @creat_

TensorFlow入門必讀教程，拿走不謝！

活性一起操作系統得到 haskell 開源 ask 服務好的 TensorFlow 是一個開源的深度學習框架，於 2015 年末發布後，它成為了在全球得到最廣泛采用的深度學習框架之一。深度學習神經網絡通常包含許多層。它們使用多維數組在不同層之間傳輸數據或執行操作。

TensorFlow入門筆記（一）基本操作

result 官方教程 with orf print blog res ont constant 0. 環境配置安裝Anaconda，python3環境，然後利用conda命令配置的tensorflow環境。參考極客學院翻譯TensorFlow官方教程：http://w

TensorFlow 入門

測試 art auto eight model img blog 選擇 edi 一、初識Tensorflow 編譯Tensorflow lite tflitecamerademo 安裝Tensorflow 通過下面鏈接安裝 http://www.tensorfly.

TensorFlow入門測試程序

ini closed ict dict clas pla 入門 ntop pos 1 import tensorflow as tf 2 from tensorflow.examples.tutorials.mnist import input_data 3

tensorflow入門——3解決問題——4讓我們開始吧

因此海量 tensor flow 改變 80年解決識別學習深度學習適合解決海量數據和復雜問題在機器學習中，語音識別，圖像識別，語意識別用的是不同的技術，從事相關工作的人合作幾乎不可能。深度學習改變了這一切。 80年代計算機很慢，數據集很小，因此深度學習沒有得到

TensorFlow入門——hello

ESS constant TE 報錯結果 port In 成功說了上一節說了TensorFlow的安裝，這一節說一下測試的問題新建一個Python文件，輸入 1 import tensorflow as tf 2 hello = tf .constant (’He

TensorFlow入門——安裝（帶GPU）

incr per 下載地址變量環境 warning ice mman sign 這一系列基本上是屬於我自己進行到了那個步驟就做到那個步驟的由於新裝了GPU (GTX750ti)和CUDA9.0、CUDNN7.1版本的軟件，所以希望TensorFlow能在GPU上運行，

知乎TensorFlow入門學習記錄

nbsp 網絡 lan ID span tar orf 形參 sta 知乎地址：https://zhuanlan.zhihu.com/p/30487008 import tensorflow as tf a=tf.placeholder(tf.int16) # 接受

Tensorflow入門----占位符、常量和Session

存在大小 operation hold 而是表示意思占位符不同安裝好TensorFlow之後，開一個python環境，就可以開始運行和使用TensorFlow了。先給一個實例， #先導入TensorFlowimport tensorflow as tf # C

tensorflow入門線性迴歸

實際上編寫tensorflow可以總結為兩步. （1）組裝一個graph; （2）使用session去執行graph中的operation。

TensorFlow入門之二：tensorflow手寫數字識別

一、基礎知識基礎知識可以跳過，可以直接看後面的程式碼實現 MNIST資料集 MNIST資料集的官網是Yann LeCun’s website。可以使用下面的python程式碼自動下載資料集。 #已經下載input_data.py #import input_data #沒有

TensorFlow入門之一：第一個機器學習Demo

版權宣告：本文為博主原創文章，未經博主允許不得轉載。 https://blog.csdn.net/geyunfei_/article/details/78782804 本文主要通過一個簡單的 Demo 介紹 TensorFlow 初級 API 的使用方法，因為自己也是初學者，因此本文的目

TensorFlow入門--Chapter02

深層神經網路

1 深層神經網路

1.1 深度學習基本概念

1.2 線性模型的侷限性

1.3 使用啟用函式去線性化

2 損失函式定義

2.1 經典損失函式

2.2 自定義損失函式

輸出結果：

2.3 神經網路優化演算法

相關推薦