深度學習訓練的常用名詞

阿新 • • 發佈：2018-12-16

本文節選自CVer《深度學習速查詞典》中的一部分內容，並補充一些常見名詞。

batch size

一次前向或反向傳播時樣本的數目，該引數受限於記憶體的大小。

iteration

樣本傳播的次數，每次傳播的樣本數為batch大小，注：一次樣本的傳播包括前向和反向傳播。

epoch

所有訓練樣本的傳播次數。例如，有1000個樣本，若batch size=500，則iteration=2時完成一次epoch。

用於調節權重衰減的超引數，公式：new_weight = existing_weight — learning_rate * gradient，即梯度下降法中使用的引數。

1. momentum(動量)

用於平滑隨機梯度下降法的振盪。


SGD without momentum	SGD with momentum

2. Adam(Adaptive Moment Estimation)

用於計算引數自適應學習率的方法，效果一般優於其他自適應學習演算法。

網路層引數

[convolutional]   #卷積層
batch_normalize=1 #批歸一化引數  
filters=32        #卷積核的數量
size=3            #卷積核的大小
stride=1          #卷積步長
pad=1             #卷積時填充畫素數
activation=leaky  #網路的啟用函式(非線性的主要根源)

[maxpool]         #池化層：最大化池化
size=2            #池化核大小
stride=2          #池化步長

Dropout

是一種在深度神經網路中隨機消除節點及其連線的正則化技術。它可以防止模型過擬合，同時加快深度神經網路的訓練速度。

參考文獻：

深度學習訓練的常用名詞

本文節選自CVer《深度學習速查詞典》中的一部分內容，並補充一些常見名詞。 batch size 一次前向或反向傳播時樣本的數目，該引數受限於記憶體的大小。

【深度學習】常用的模型評估指標

是我初學者 cnblogs 沒有線下均衡顯示總數效果 “沒有測量，就沒有科學。”這是科學家門捷列夫的名言。在計算機科學中，特別是在機器學習的領域，對模型的測量和評估同樣至關重要。只有選擇與問題相匹配的評估方法，我們才能夠快速的發現在模型選擇和訓練過程中可能出現的

深度學習訓練技巧---權重初始化

常量反向傳播 ive str 防止自己對稱性就是導致全零初始化　　全零初始化即所有的變量均被初始化為0，這應該是最笨、最省事的隨機化方法了。然而這種偷懶的初始化方法非常不適合深度學習，因為這種初始化方法沒有打破神經元之間的對稱性，將導致收斂速度很慢甚至訓練失敗

聊一聊深度學習中常用的激勵函式

大家都知道，人腦的基本計算單元叫做神經元。現代生物學表明，人的神經系統中大概有860億神經元，而這數量巨大的神經元之間大約是通過1014−1015個突觸連線起來的。上面這一幅示意圖，粗略地描繪了一下人體神經元與我們簡化過後的數學模型。每個神經元都從樹突接受訊號，同時順著某個軸突傳遞

深度學習最常用的演算法:Adam優化演算法

深度學習常常需要大量的時間和機算資源進行訓練，這也是困擾深度學習演算法開發的重大原因。雖然我們可以採用分散式並行訓練加速模型的學習，但所需的計算資源並沒有絲毫減少。而唯有需要資源更少、令模型收斂更快的最優化演算法，才能從根本上加速機器的學習速度和效果，Adam 演算法正為此而生！ Ad

深度學習幾個名詞的淺度理解

學習機器學習大有半個月了，還是雲裡霧裡的，其中學習的道路是，先在B站觀看吳恩達視訊，看了兩遍，中間有過走神，更多是看彈幕裝X，也許是自己確實基礎薄弱吧，效果不太好，後來看了李巨集毅的視訊，懂了不少，不過被神奇寶貝搞蒙圈了，哈哈，現在看的是莫凡的Tensorflow視訊，感覺還不錯，結合淘寶買

深度學習訓練評價指標

深度學習分類任務評價指標 PR曲線即查準率（Precision）與查全率（Recall） https://blog.csdn.net/zong596568821xp/article/details/80797695 深度學習常用評價指標（分類清晰） https://

深度學習中常用的影象資料增強方法

影象資料增強方法概述影象資料準備對神經網路與卷積神經網路模型訓練有重要影響，當樣本空間不夠或者樣本數量不足的時候會嚴重影響訓練或者導致訓練出來的模型泛化程度不夠，識別率與準確率不高！本文將會帶你學會如何對已有的影象資料進行資料增強，獲取樣本的多樣性與資料的多

深度學習訓練中關於資料處理方式--原始樣本採集以及資料增廣

好久沒有寫部落格，一直想重新調整自己的部落格，想盡可能寫的前後連貫一點，同時希望自己寫的更通熟易懂些，可是遲遲沒有動筆修改曾經的博文，哎，還是慢慢跟著自己的理解再修改之前的文章吧，今兒就寫寫關於深度學習訓練中最關鍵的一步，資料問題，也就是樣本庫的建立！來

深度學習的專有名詞

基礎名詞篇 1. 神經元就像神經元構成我們大腦的基本組成部分一樣，神經元形成神經網路的基本結構。想想當我們人腦獲得一個新資訊時我們會做什麼，當我們得到資訊時，我們會處理它，然後生成一個輸出。類似的，神經網路中的神經元接收一個輸入，處理它併產生一個輸出，輸出被髮送

如何解決機器學習深度學習訓練集樣本不均衡的問題！

解決樣本不均衡的問題很多，主流的幾個如下： 1.樣本的過取樣和欠取樣。 2..使用多個分類器進行分類。 3.將二分類問題轉換成其他問題。 4.改變正負類別樣本在模型中的權重。一、樣本的過取樣和欠取樣。 1.過取樣：將稀有類別的樣本進行復制，通過增加此稀有

深度學習(訓練/開發/測試集)的劃分技巧

github部落格傳送門部落格園傳送門小資料量時代(100 - 1000 - 10000條左右): 一. 70%訓練集 , 30%測試集二. 60%訓練集 , 20%交叉驗證集 , 20%測試集大資料量時代(1000000條左右或更多): 一. 98%訓練集 ,

G2P(單詞到音素)的深度學習訓練測試

音素提取是語音識別中的一塊重要內容。 G2P（Grapheme-to-Phoneme），英文意思是字素到音素，使用迴圈神經網路(recurrent neural network,RNN) 和LSTM( long short-termmemory units)，來實現從英

Caffe的深度學習訓練全過程

本文為大資料雜談4月20日微信社群分享內容整理。今天的目標是使用Caffe完成深度學習訓練的全過程。Caffe是一款十分知名的深度學習框架，由加州大學伯克利分校的賈揚清博士於2013年在Github上釋出。自那時起，Caffe在研究界和工業界都受到了極大的關注。Caf

深度學習訓練資料python程式碼——資料增廣（二）

python影象資料增強庫 Augmentor使用比較簡單,只有一些簡單的操作。 imgaug實現的功能更多，可以對keypoint, bounding box同步處理，比如你現在由一些標記好的資料，只有同時對原始圖片和標記資訊同步處理，才能有更多的標記資料進行訓練。我

深度學習中常用的代價函式

1.二次代價函式(quadratic cost)：其中，C表示代價函式，x表示樣本，y表示實際值，a表示輸出值，n表示樣本的總數。為簡單起見，使用一個樣本為例進行說明，此時二次代價函式為：假如我們使用梯度下降法(Gradient descent)來調整權值引數的大

設定可見GPU，進行多顯示卡深度學習訓練

在深度學習中，如果一臺電腦具有多個NVIDIA的GPUs，使用者想要在不同的GPU上訓練不同的網路，那麼在程式中指定佔用的GPU的id，在python中如： import os os.environ[

VggNet10模型的cifar10深度學習訓練

先放些連結 cifar10的資料集的下載地址：http://www.cs.toronto.edu/~kriz/cifar.html 用二進位制tfcords的資料集訓練，下載第三個，下載的資料檔案集是這樣的上面下載的檔案中，data_batch_(num).bin是訓

深度學習中常用的層：Full Connect全連線層

全連線層的推導全連線層的每一個結點都與上一層的所有結點相連，用來把前邊提取到的特徵綜合起來。由於其全相連的特性，一般全連線層的引數也是最多的。全連線層的前向計算下圖中連線最密集的2個地方就是全連線層，這很明顯的可以看出全連線層的引數的確很多。在前向計算過程，也就是一個線性的加

深度學習——訓練trick

1、資料預處理資料必須進行預處理以使其zero-mean。影象處理中有兩種方式中心化：減去均值影象（32，32，3）；減去每通道均值（3個值）。 2、梯度檢查使用中心形式：使用雙精度：

深度學習訓練的常用名詞

相關推薦