1. 程式人生 > >深度學習之正則化系列(2):資料集增強(資料增廣)

深度學習之正則化系列(2):資料集增強(資料增廣)

讓機器學習模型泛化得更好的最好辦法是使用更多的資料進行訓練。當然,在實踐中,我們擁有的資料量是很有限的。解決這個問題的一種方法是建立假資料並新增到訓練集中。對於一些機器學習任務,建立新的假資料相當簡單。對分類來說這種方法是最簡單的。分類器需要一個複雜的高維輸入 x,並用單個類別標識 y 概括 x。這意味著分類面臨的一個主要任務是要對各種各樣的變換保持不變。我們可以輕易通過轉換訓練集中的 x 來生成新的 (x; y) 對。

目前在做過的影象處理裡面比較多,常見有對資料幾何變換,灰度處理等!但旋轉的時候也需要特別注意,比如,數字6和9在手寫中旋轉就…….

常見的幾何變換有:(1)翻轉,(2)平移(3)部分置黑
水平翻轉,豎直翻轉!其實翻轉也不是隨意翻轉的,要根據實際情況來翻轉,比如,關於人臉,你上下翻轉了就變成倒的人臉了,這個就沒有了實際意義,如果是左右翻轉了,也沒有太大的實際意義,因為人臉是對稱的,你翻轉之後還是一樣的!但是對於那些沒有對稱結構的物體圖片,你做翻轉還是挺有作用的,就相當於有兩條資料了啊!