1. 程式人生 > >機器學習筆記(十):TensorFlow實戰二(深層神經網路)

機器學習筆記(十):TensorFlow實戰二(深層神經網路)

1 - 深度學習與深層神經網路

深度學習的精確定義為:“一類通過多層非線性變換對高複雜性資料建模演算法的集合”

因此,多層神經網路有著2個非常重要的特性

  • 多層

  • 非線性

1.1 - 線性模型的侷限性

線上性模型中,模型的輸出為輸入的加權和,假設一個模型的輸出y和輸入 x i x_i

滿足以下關係,那麼這麼模型就是一個線性模型
y = i w i
x i + b y=\sum_{i}w_ix_i+b

其中 w
i b R w_i,b\in R
為模型的引數,而一個線性模型的最大特點是任意線性模型的組合仍然還是線性模型

前向傳播的計算公式為: a ( 1 ) = x W ( i ) a^{(1)}=xW^{(i)} , y = a ( 1 ) W ( 2 ) y=a^{(1)} W^{(2)}
其中x為輸入,W為引數。整理一下上面的公式可以得到整個模型的輸出為:
y = ( x W ( 1 ) ) W ( 2 ) y=(xW^{(1)})W^{(2)}
根據矩陣乘法的結合律有:
y = x ( W ( 1 ) W ( 2 ) ) = X W y=x(W^{(1)}W^{(2)})=XW^{'}
W ( 1 ) W ( 2 ) W^{(1)}W^{(2)}
根據矩陣乘法的結合律有:
y = x ( W ( 1 ) W ( 2 ) ) = X W y=x(W^{(1)}W^{(2)})=XW^{'}
W ( 1 ) W ( 2 ) W^{(1)}W^{(2)} 其實可以被表示為一個新的引數 W W^{'} :
W = x ( W ( 1 ) W ( 2 ) ) = [ W 1 , 1 ( 1 ) W 1 , 2 ( 1 ) W 1 , 3 ( 1 ) W 2 , 1 ( 1 ) W 2 , 2 ( 1 ) W 2 , 3 ( 1 ) ] [ W 1 , 1 ( 2 ) W 2 , 1 ( 2 ) W 3 , 1 ( 2 ) ] = [ W 1 , 1 ( 1 ) W 1 , 1 ( 2 ) + W 1 , 2 ( 1 ) W 2 , 1 ( 2 ) + W 1 , 3 ( 1 ) W 3 , 1 ( 2 ) W 2 , 1 ( 1 ) W 1 , 1 ( 2 ) + W 2 , 2 ( 1 ) W 2 , 1 ( 2 ) + W 2 , 3 ( 1 ) W 3 , 1 ( 2 ) ] = [ W 1 W 2 ] W^{'}=x(W^{(1)}W^{(2)})=\begin{bmatrix} W_{1,1}^{(1)}& W_{1,2}^{(1)}& W_{1,3}^{(1)}\\ W_{2,1}^{(1)} & W_{2,2}^{(1)} & W_{2,3}^{(1)} \end{bmatrix}\begin{bmatrix} W_{1,1}^{(2)} \\ W_{2,1}^{(2)} \\ W_{3,1}^{(2)} \end{bmatrix}=\begin{bmatrix} W_{1,1}^{(1)}W_{1,1}^{(2)}+ W_{1,2}^{(1)}W_{2,1}^{(2)}+ W_{1,3}^{(1)}W_{3,1}^{(2)} \\ W_{2,1}^{(1)}W_{1,1}^{(2)}+ W_{2,2}^{(1)}W_{2,1}^{(2)}+ W_{2,3}^{(1)}W_{3,1}^{(2)} \end{bmatrix}=\begin{bmatrix} W_1^{'} \\ W_2^{'} \end{bmatrix}

相關推薦

機器學習筆記TensorFlow實戰深層神經網路

1 - 深度學習與深層神經網路 深度學習的精確定義為:“一類通過多層非線性變換對高複雜性資料建模演算法的集合” 因此,多層神經網路有著2個非常重要的特性 多層 非線性 1.1 - 線性模型的侷限性 線上性模型中,模型的輸出為輸入的加權和,假設一

機器學習筆記 TensorFlow實戰MNIST數字識別問題

1 - MNIST數字識別問題 前面介紹了這樣用TensorFlow訓練一個神經網路模型和主要考慮的問題及解決這些問題的常用方法。下面我們用一個實際的問題來驗證之前的解決方法。 我們使用的是MNIST手寫數字識別資料集。在很多深度學習教程中,這個資料集都會被當做一個案例。 1.1

機器學習筆記TensorFlow實戰經典卷積神經網路VGG

1 - 引言 之前我們介紹了LeNet-5和AlexNet,在AlexNet發明之後,卷積神經網路的層數開始越來越複雜,VGG-16就是一個相對前面2個經典卷積神經網路模型層數明顯更多了。 VGGNet是牛津大學計算機視覺組(Visual Geometry Group)和Google

機器學習筆記TensorFlow實戰經典卷積神經網路AlexNet

1 - 引言 2012年,Imagenet比賽冠軍的model——Alexnet [2](以第一作者alex命名)。這個網路算是一個具有突破性意義的模型 首先它證明了CNN在複雜模型下的有效性,然後GPU實現使得訓練在可接受的時間範圍內得到結果,讓之後的網路模型構建變得更加複雜,並且通過

機器學習筆記TensorFlow實戰影象識別與卷積神經網路

1 - 卷積神經網路常用結構 1.1 - 卷積層 我們先來介紹卷積層的結構以及其前向傳播的演算法。 一個卷積層模組,包含以下幾個子模組: 使用0擴充邊界(padding) 卷積視窗過濾器(filter) 前向卷積 反向卷積(可選) 1.1

機器學習筆記TensorFlow實戰十三遷移學習

1 - 引言 越複雜的神經網路,需要的訓練集越大,ImageNet影象分類資料集有120萬標註圖片,所以才能將152層的ResNet的模型訓練到大約96.%的正確率。但是在真正的應用中,很難收集到如此多的標註資料。即使收集到也需要花費大量人力物力來標註。並且即使有了大量的資料集,要訓練一

機器學習筆記TensorFlow實戰經典卷積神經網路ResNet

1 - 引言 我們可以看到CNN經典模型的發展從 LeNet -5、AlexNet、VGG、再到Inception,模型的層數和複雜程度都有著明顯的提高,有些網路層數更是達到100多層。但是當神經網路的層數過高時,這些神經網路會變得更加難以訓練。 一個特別大的麻煩就在於訓練的時候會產

機器學習筆記TensorFlow實戰經典卷積神經網路GoogLeNet

1 - 引言 GoogLeNet, 在2014年ILSVRC挑戰賽獲得冠軍,將Top5 的錯誤率降低到6.67%. 一個22層的深度網路 論文地址:http://arxiv.org/pdf/1409.4842v1.pdf 題目為:Going deeper with convolu

機器學習筆記Tensorflow 實戰Tensorflow入門

1 - TsensorFlow計算模型 ——計算圖 1.1- 計算圖的概念 計算圖是TensorFlow中最基本的一個概念,TensorFlow中的所有計算都會被轉化為計算圖上的節點。 在TensorFlow中,張量可以簡單地理解為多為陣列。如果說TensorFlow的第一個詞T

機器學習筆記十三TensorFlow實戰經典卷積神經網路 LeNet -5

1 - 引言 之前我們介紹了一下卷積神經網路的基本結構——卷積層和池化層。通過這兩個結構我們可以任意的構建各種各樣的卷積神經網路模型,不同結構的網路模型也有不同的效果。但是怎樣的神經網路模型具有比較好的效果呢? 下圖展示了CNN的發展歷程。 經過人們不斷的嘗試,誕生了許多有

Andrew NG 機器學習 筆記-week11-應用例項圖片文字識別Application ExamplePhoto OCR

1、問題描述和流程圖(Problem Description and Pipeline) photo OCR:photo Optical Character Recognition 影象文字識別,要求從一張給定的圖片中識別文字。 為了完成這樣的工作,需

《Javascript權威指南》學習筆記BOM新成就1--client存儲數據Storage實現

globals 機制 ng- url new onclick views watermark -c 版權聲明:本文為博主原創文章。未經博主同意不得轉載。 https://blog.csdn

機器學習筆記TensorFlow實戰TensorBoard視覺化

1 - 引言 前面已經介紹到TensorFlow可以實現許多非常常用的神經網路結構,有的網路結構十分複雜,裡面的引數關係更是難以管理。因此,TensorFlow提供了一個視覺化工具TensorBoard。可以有效的展示執行過程中的計算圖、各種指標隨著時間的變化趨勢以及訓練中使用到的影象等

機器學習筆記TensorFlow實戰多執行緒輸入資料

1 - 引言 為了加速模型訓練的時間,TensorFlow提供了一套多執行緒處理輸入資料的框架。 下面我們來詳細的介紹如何使用多執行緒來加速我們的模型訓練速度 2 - 佇列與多執行緒 在TensorFlow中,佇列和變數類似,我們可以修改它們的狀態。下面給出一個示例來展示如

機器學習筆記TensorFlow實戰影象資料處理

1 - 引言 之前我們介紹了通過卷積神經網路可以給影象識別技術帶來突破性的進展,現在我們從影象的預處理這個角度來繼續提升我們影象識別的準確率。 輸入的預處理需要使用TFRecord格式來同一不同的原始資料格式,並且更加有效的管理不同的屬性。 並且TensorFlow支援影象處理函式,

機器學習筆記TensorFlow實戰影象風格遷移

1 - 引言 相信大家都使用過一種濾鏡,可以把一張照片轉換成不同風格的照片,如下圖所示: 那麼我們就來利用TensorFlow來實現以下這個演算法,這個演算法出自Gatys的A Neural Algorithm of Artistic Style論文,十分有趣,讓我們來詳細的介紹一下這

機器學習筆記TensorFlow實現四影象識別與卷積神經網路

1 - 卷積神經網路常用結構 1.1 - 卷積層 我們先來介紹卷積層的結構以及其前向傳播的演算法。 一個卷積層模組,包含以下幾個子模組: 使用0擴充邊界(padding) 卷積視窗過濾器(filter) 前向卷積 反向卷積(可選) 1.1.2 - 邊界填充

吳恩達機器學習筆記 —— 19 應用舉例照片OCR光學字符識別

參考 https ocr 噪聲 也說 字符 www. 定位 cnblogs http://www.cnblogs.com/xing901022/p/9374258.html 本章講述的是一個復雜的機器學習系統,通過它可以看到機器學習的系統是如何組裝起來的;另外也說明了一

機器學習》 周志華學習筆記四章 概率圖模型課後習題python實現

一、基本內容 1.隱馬爾可夫模型 1.1. 假定所有關心的變數集合為Y,可觀測變數集合為O,其他變數集合為R, 生成式模型考慮聯合分佈P(Y,R,O),判別式模型考慮條件分佈P(Y,R|O),給定一組觀測變數值,推斷就是要由P(Y,R,O)或者P(Y,R|O)得到條件概率分佈P(Y,

吳恩達機器學習筆記 —— 19 應用舉例照片OCR光學字元識別

本章講述的是一個複雜的機器學習系統,通過它可以看到機器學習的系統是如何組裝起來的;另外也說明了一個複雜的流水線系統如何定位瓶頸與分配資源。 OCR的問題就是根據圖片識別圖片中的文字: 這種OCR識別的問題可以理解成三個步驟: 文字檢測 字元切分 字元識別 文字檢測 文字的檢測可以用行人的檢測來做