李巨集毅機器學習筆記-6 深度學習簡介（Brief Introduction of Deep Learning）

阿新 • • 發佈：2019-02-01

Brief Introduction of Deep Learning - 深度學習簡介

1. 前言

deep learning 在近些年非常熱門，從2012年開始，深度學習的應用數目幾乎是呈指數增長的。
深度學習的發展史如下圖：

2. 深度學習的步驟

1526262040728

2.1 第一步：定義一個神經網路

Neural

神經網路由神經元組成，每個神經元如上圖所示，每個神經元都有一個 bias 和一個 function ，每條輸入的邊都有一個 weight。
假設這個神經元的輸入是 $(a 1, a 2, a 3)$ ，則最後的輸出是
$s i g m a (a 1 * w 1 + a 1 * w 2 + a 3 * w 3 + b i a s)$ ，輸入和輸出都是一個 向量（vector）。
神經網路有許多神經元組合而成，神經元之間的連線一般為全連線（fully connect），第一層是輸入層（input layer），最後一層是輸出層（output layer），中間的叫做隱層（hidden layers），前一層的輸出作為後一層的輸入。
深度學習中的所謂深度就是指神經網路有很多 hidden layers。
神經網路的計算可以轉換成矩陣計算，這麼做的好處就是可以用 GPU 進行加速，可以大幅度提高計算效率。

1526264321724

例子： 手寫數字辨識
- 輸入： 一張 16*16 的圖片，即 256 維的向量
- 輸出： 一個 10 維的向量
- 如何決定神經網路的結構？ 一般只能通過經驗加嘗試，還有你的直覺。真是玄學~
還有一些方法能讓機器自己去學習出神經網路的結構，但是還不成熟。也有一些其他的除全連線之外的結構，比如 卷積神經網路（Convolutional Neural Network）。

2.2 定義一個函式的好壞(Loss Function)

可以有很多種方法，其中有一種方法是計算 Cross Entropy，公式如下：

Total Loss:

2.3 找出最好的函式

沒有其他的，就是用 梯度下降法（Gradient Descent），但是因為深度學習的函式太複雜，要直接計算微分的話，計算量實在太大了，所以一般會用一個叫做 反向傳播（Backpropagation）

的演算法來做，這個演算法會在之後詳細介紹。

3 一些廢話

再說一句，雖然我們是用 Backpropagation 來幫我們算微分，但是其實就連這個我們都不會自己去算，基本都是用一些工具來幫我們，比如 TensorFlow。到此結束了嗎？沒有的，人這麼懶的生物，覺得 TensorFlow 也太複雜了，所以又寫了一堆 API 去直接呼叫 TensorFlow ，這就是之後會講到的 Keras，果然懶才能推動人類不斷進步。
由於上述原因，大部分搞機器學習就是調調包，跟疊積木一樣，不知道這是好還是不好。我也只是個初學者，希望能在這條路上走得遠一些。

李巨集毅機器學習筆記-6 深度學習簡介（Brief Introduction of Deep Learning）

Brief Introduction of Deep Learning - 深度學習簡介 1. 前言 deep learning 在近些年非常熱門，從2012年開始，深度學習的應用數目幾乎是呈指數增長的。深度學習的發展史如下圖：

李巨集毅機器學習 P13 Brief Introduction of Deep Learning 筆記

deep learning的熱度增長非常快。下面看看deep learning的歷史。最開始出現的是1958年的單層感知機，1969年發現單層感知機有限制，到了1980年代出現多層感知機（這和今天的深度學習已經沒有太大的區別），1986年又出現了反向傳播演算法（通常超過3

[機器學習入門] 李巨集毅機器學習筆記-6 （Classification: Logistic Regression；邏輯迴歸）

[機器學習] 李巨集毅機器學習筆記-6 （Classification: Logistic Regression；Logistic迴歸） PDF VIDEO Three steps Step 1: Function Set

李巨集毅機器學習課程6~~~深度學習入門

深度學習歷史深度學習經典步驟神經網路的符合標記含義 Wij 代表的是從神經元ｊ到神經元ｉ，這樣寫的目的是便於表達，否則最後的表示式子就是Wij的

【ML】李巨集毅機器學習筆記

我的github連結 - 課程相關程式碼： https://github.com/YidaoXianren/Machine-Learning-course-note 0. Introduction Machine Learning: define a set of function

李巨集毅機器學習 P14 Backpropagation 筆記

chain rule：求導的鏈式法則。接著上一節，我們想要minimize這個loss的值，我們需要計算梯度來更新w和b。以一個neuron舉例：這個偏微分的結果就是輸入x。比如下面這個神經網路：下面我們要計算這個偏微分：。這裡的以si

李巨集毅機器學習 P12 HW2 Winner or Loser 筆記（不使用框架實現使用MBGD優化方法和z_score標準化的logistic regression模型）

建立logistic迴歸模型：根據ADULT資料集中一個人的age，workclass，fnlwgt，education，education_num，marital_status，occupation等資訊預測其income大於50K或者相反（收入）。資料集： ADULT資料集。

李巨集毅機器學習P11 Logistic Regression 筆記

我們要找的是一個概率。 f即x屬於C1的機率。上面的過程就是logistic regression。下面將logistic regression與linear regression作比較。接下來訓練模型，看看模型的好壞。假設有N組trainin

李巨集毅機器學習 P15 “Hello world” of deep learning 筆記

我們今天使用Keras來寫一個deep learning model。 tensorflow實際上是一個微分器，它的功能比較強大，但同時也不太好學。因此我們學Keras，相對容易，也有足夠的靈活性。李教授開了一個玩笑：下面我們來寫一個最簡單的deep learning mo

李巨集毅機器學習P7 Gradient Descent (Demo by AOE) 筆記、P8 Gradient Descent (Demo by Minecraft) 筆記

P7 Gradient Descent (Demo by AOE) 筆記：在進行Gradient Decent時，我們可以類似玩遊戲帝國時代時探索地圖的情況。在地圖沒有探索前，你的視野範圍只有很小的一個圈，你不知道圈外的黑幕下面有什麼東西。現在我們假設地圖上的海拔

李巨集毅機器學習PTT的理解（1）深度學習的介紹

深度學習的介紹機器學習就像是尋找一個合適的函式，我們輸入資料就可以得到想要的結果，比如：在語音識別中，我們輸入一段語音，函式的輸出值就是識別的結果；在影象識別中，輸入一張照片，函式可以告訴我們分類

李巨集毅機器學習筆記——02.Where does the error come from ?

傳送門：在上節課講到，如果選擇不同的function set就是選擇不同的model 在testing data上會得到不同的error，而且越複雜的model不見得會給你越低的error，我們要討論的問題就是error來自什麼地方？ error有兩個來源，偏

李巨集毅機器學習-學習筆記

function set就是model 機器學習3大步驟: 1. 定義模型(function)集合 2. 指定模型(function)好壞的評價指標 3. 通過演算法選擇到最佳的模型(function) alphago下棋模型抽象為棋局向下一步的分類問題: 減少擁有label的data用量的方法: 1.