fast.ai 深度學習筆記：第一部分第二課

阿新 • • 發佈：2018-11-11

原文：Deep Learning 2: Part 1 Lesson 2

作者：Hiromi Suenaga

回顧上一課 [01:02]

我們使用 3 行程式碼來構建影象分類器。
為了訓練模型，需要在PATH下以某種方式組織資料（在本例中為data/dogscats/ ）：

image

應該有train資料夾和valid資料夾，並且在每個資料夾下都有帶有分類標籤的資料夾（例如本例中的cats ），其中包含相應的影象。

訓練輸出： [epoch #, training loss, validation loss, accuracy]

 [ 0\. 0.04955 0.02605 0.98975]

學習率 [4:54]

學習率的基本思想是，它將決定我們解決方案改進的速度。

image

如果學習率太小，則需要很長時間才能達到最低點。
如果學習率太大，它可能會在底部擺動。
學習率查詢器（ learn.lr_find ）將在每個小批量之後提高學習率。最終，學習率太高，損失會變得更糟。然後，我們檢視學習率與損失的關係曲線，確定最低點並返回一個幅度，並選擇它作為學習率（下例中為1e-2

）。
小批量是我們每次檢視的一組影象，因此我們有效地使用 GPU 的並行處理能力（通常一次 64 或 128 個影象）
在 Python 中：

image

通過調整這一個數字，你應該能夠獲得相當不錯的結果。 fast.ai 庫為你選擇其餘的超引數。但隨著課程的進展，我們將瞭解到還有一些我們可以調整的東西，可以獲得更好的結果。但學習率是我們設定的關鍵數字。

學習率查詢器位於其他優化器（例如動量，Adam 等）的上層，並根據你正在使用的調整（例如高階優化器但不限於優化器）幫助你選擇最佳學習率。
問題：在迭代期間改變學習率，優化器會發生什麼？這個查詢器是否選擇了初始學習率？ [14:05] 我們稍後會詳細瞭解優化器，但基本答案是否定的。即使 Adam 的學習率也會除以先前的平均梯度以及最近的梯度的平方和。即使那些所謂的“動態學習率”方法也具有學習率。
使模型更好的最重要的事情是，為它提供更多資料。由於這些模型有數百萬個引數，如果你訓練它們一段時間，它們就會開始所謂的“過擬合”。
過擬合 - 模型開始在訓練集中看到影象的具體細節，而不是學習可以傳遞到驗證集的一般內容。
我們可以收集更多資料，但另一種簡單方法是資料增強。

閱讀更多

fast.ai 深度學習筆記：第一部分第二課

原文：Deep Learning 2: Part 1 Lesson 2 作者：Hiromi Suenaga 論壇筆記本回顧上一課 [01:02] 我們使用 3 行程式碼來構建影象分類器。為了訓練模型，需要在PATH下以某種方式組織資料（在本例中為data/do

fast.ai 深度學習筆記：第一部分第五課

原文：Deep Learning 2: Part 1 Lesson 5 作者：Hiromi Suenaga 課程論壇一，引言沒有足夠的關於結構化深度學習的出版物，但它肯定出現在行業中：結構化深度學習，作者：Kerem Turgutlu @datascience.com

fast.ai 深度學習筆記：第一部分第四課

原文：Deep Learning 2: Part 1 Lesson 4 作者：Hiromi Suenaga 課程論壇學生的文章：改善學習率的方式迴圈學習率技術探索帶有重啟動的隨機梯度下降（SGDR）使用差異學習率的遷移學習讓計算機看得比人類更好

fast.ai 深度學習筆記：第一部分第一課

原文：Deep Learning 2: Part 1 Lesson 1 作者：Hiromi Suenaga 課程論壇入門 [0:00]：為了訓練神經網路，你肯定需要圖形處理單元（GPU） - 特別是 NVIDIA GPU，因為它是唯一支援 CUDA（幾乎所有深度學習庫和

fast.ai 深度學習筆記：第一部分第三課

原文：Deep Learning 2: Part 1 Lesson 3 作者：Hiromi Suenaga 課程論壇學生建立的有用材料： AWS 操作方法 TMUX 第 2 課總結學習率查詢器 PyTorch

deeplearning.ai學習筆記：第一課第四周

1 深層神經網路引數： W [

deeplearning.ai學習筆記：第一課第三週

1 神經網路的表示在計算神經網路的層數時，一般不把輸入層計算在內。如一個由輸入層、單隱藏層、輸出層組成的神經網路，一般叫做是兩層的神經網路。上述單隱藏神經元的神經網路，神經元要做兩件事情，一是計算 z

deeplearning.ai學習筆記：第一課第二週

1 二分類 m樣本數目，n樣本特徵數目建議使用的符號表示 X =

deeplearning.ai學習筆記：第一課第一週

1 什麼是神經網路？上圖是傳統意義上的神經網路。輸入層、隱藏層、輸出層；我們沒有指定神經網路各隱藏單元的含義，只是給定了輸入，也明確了輸入的含義，由神經網路自己來確定各隱藏單元的含義；全連線的神經網路，連線數很多。 2 用神經網路做監督學

學習筆記：第一天

內建函式lis = list(range(5))print(lis)#map函式。處理序列中的每個元素，得到一個“列表”，該“列表”元素個數與位置與原來一樣print(list(map(lambda x:x+1,list(range(19)))))r ='adasdafgafaf'print(list(map

深度學習筆記：tensorflow 入門變數初始化

# 變數op # 1、變數能夠持久化儲存，普通的張量op是不行的 # 2、當定義一個變數op的時候，一定要在會話當中去執行初始化 a = tf.constant([1, 2, 3, 4, 5]) var = tf.Variable(tf.random_no

斯坦福大學深度學習筆記：邏輯迴歸

z 邏輯迴歸（LOGISTIC REGRESSION） Logistic regression （邏輯迴歸）是當前業界比較常用的機器學習方法，用於估計某種事物的可能性。之前在經典之作《數學之美》中也看到了它用於廣告預測，也就是根據某廣告被使用者點選的可

第9篇 Fast AI深度學習課程——多目標識別與定位

一、一個模型同時實現單目標識別與定位在上一節中，我們先構建了一個分類網路，用於圖片中最大目標的類別劃分；然後構建了一個用於輸出目標座標的網路。我們尚未將兩個網路聯絡起來。但事實上，兩個網路的架構十分相似(都是基於resnet34)。那麼能否去除這種冗餘，使用一個網路同時實現目標分類與定

第8篇 Fast AI深度學習課程——單目標識別與定位

一、前情回顧與課程展望本系列課程的第一部分——神經網路入門與實踐已結束，在該部分的1-7課中，我們通過影象分類網路(包括多類別分類)、時間序列處理、影評資料情感分析(包括構建語言模型、協同濾波)等例項，學習了Fast.AI的API，熟悉了使用神經網路解決實際問題的流程，掌握了網路調參中

斯坦福大學深度學習筆記：神經網路

神經網路演算法在八十到九十年代被廣泛使用過， 20世紀90年代，各種各樣的淺層機器學習模型相繼被提出，例如支撐向量機（SVM，Support Vector Machines）、 Boosting、最大熵方法（如LR，Logistic Regression）等。但之後便使用的變少了。但最近又開始流行起來了，原

《計算機系統要素》學習筆記：第一章布林邏輯

1.工具準備本書需要的工具和資源下載址：http://www.nand2tetris.org/software.php 工具分為tools和project兩個資料夾，開啟tools資料夾，開啟ha

Coursera deeplearning.ai 深度學習筆記1-4-Deep Neural Networks-深度神經網路原理推導與程式碼實現

在掌握了淺層神經網路演算法後，對深度神經網路進行學習。 1. 原理推導 1.1 深度神經網路表示定義：L表示神經網路總層數，上標[l]代表第l層網路，n[l]代表第l層的節點數，a[l]

流程python學習筆記：第一章

這一章中作者簡要的介紹了python資料模型，主要是python的一些特殊方法。比如__len__, __getitem__. 並用一個紙牌的程式來講解了這些方法首先介紹下Tuple和nametuple的區別： Nametuple是類似於元組的資料型別。除了能夠用索引來

深度學習筆記：稀疏自編碼器（1）——神經元與神經網路

筆者在很久以前就已經學習過UFLDL深度學習教程中的稀疏自編碼器，近期需要用到的時候發現有些遺忘，溫習了一遍之後決定在這裡做一下筆記，本文不是對神經元與神經網路的介紹，而是筆者學習之後做的歸納和整理，打算分為幾篇記錄。詳細教程請見UFLDL教程，看完教程之後

深度學習筆記：卷積神經網路的Tensorflow實現

在上一講中，我們學習瞭如何利用 numpy 手動搭建卷積神經網路。但在實際的影象識別中，使用 numpy 去手寫 CNN 未免有些吃力不討好。在 DNN 的學習中，我們也是在手動搭建之後利用 Tensorflow 去重新實現一遍，一來為了能夠對神經網路的傳播機制能夠理

fast.ai 深度學習筆記：第一部分第二課

回顧上一課 [01:02]

學習率 [4:54]

相關推薦