深度學習之正則化系列（2）：資料集增強（資料增廣）

阿新 • • 發佈：2019-01-03

讓機器學習模型泛化得更好的最好辦法是使用更多的資料進行訓練。當然，在實踐中，我們擁有的資料量是很有限的。解決這個問題的一種方法是建立假資料並新增到訓練集中。對於一些機器學習任務，建立新的假資料相當簡單。對分類來說這種方法是最簡單的。分類器需要一個複雜的高維輸入 x，並用單個類別標識 y 概括 x。這意味著分類面臨的一個主要任務是要對各種各樣的變換保持不變。我們可以輕易通過轉換訓練集中的 x 來生成新的 (x; y) 對。

目前在做過的影象處理裡面比較多，常見有對資料幾何變換，灰度處理等！但旋轉的時候也需要特別注意，比如，數字6和9在手寫中旋轉就…….

常見的幾何變換有:（1）翻轉,（2）平移（3）部分置黑
水平翻轉，豎直翻轉！其實翻轉也不是隨意翻轉的，要根據實際情況來翻轉，比如，關於人臉，你上下翻轉了就變成倒的人臉了，這個就沒有了實際意義，如果是左右翻轉了，也沒有太大的實際意義，因為人臉是對稱的，你翻轉之後還是一樣的！但是對於那些沒有對稱結構的物體圖片，你做翻轉還是挺有作用的，就相當於有兩條資料了啊！

深度學習之正則化系列（2）：資料集增強（資料增廣）

深度學習之正則化系列（2）：資料集增強（資料增廣）

機器學習之正則化（Regularization）

系統學習機器學習之正則化（二）

深度學習基礎--正則化與norm--區域性響應歸一化層(Local Response Normalization, LRN)

深度學習基礎--正則化與norm--Ln正則化綜述

深度學習基礎--正則化與norm--L1範數與L2範數的聯絡

深度學習基礎--正則化與norm--正則化(Regularization)

深度學習基礎--正則化與norm--正則化技術

theano學習之正則化

深度學習 --- 優化入門六（正則化、引數範數懲罰L0、L1、L2、Dropout）

機器學習演算法之正則化

機器學習筆記——正則化（regularization）

深度神經網路之正則化

機器學習5 正則化的線性迴歸（Regularized Linear Regression）和偏差對方差（Bias v.s. Variance）

機器學習總結之正則化

人臉識別正則化系列之normface

python3學習之正則

python學習之正則表達式

Java學習之正則表達式

HIVE之正則化詳解

深度學習之正則化系列（2）：資料集增強（資料增廣）

相關推薦