自從學了這個方法，深度學習再也不愁沒錢買數據集了">自從學了這個方法，深度學習再也不愁沒錢買數據集了

雷鋒網 AI科技評論按：深度學習大牛吳恩達曾經說過：做AI研究就像造宇宙飛船，除了充足的燃料之外，強勁的引擎也是必不可少的。假如燃料不足，則飛船就無法進入預定軌道。而引擎不夠強勁，飛船甚至不能升空。類比於AI，深度學習模型就好像引擎，海量的訓練數據就好像燃料，這兩者對於AI而言同樣缺一不可。

在深度學習中，當數據量不大時可能會導致過擬合，使得訓練誤差很小，但測試誤差卻特別大。怎麽辦呢，你又沒錢買數據？顯然最好的辦法（之一，其他方法請參看“ 當數據量不夠大的時候 ”）就是自己“造”數據——人工增加訓練集的大小，也就是Data Augmentation Transformation。

不同的任務背景下，通常我們可以通過圖像的幾何變換，使用例如剪切、旋轉/反射/翻轉變換、縮放變換、平移變換、尺度變換、對比度變換、噪聲擾動、顏色變換等一種或多種組合數據增強變換的方式來增加數據集的大小。例如假如你的數據集只有10張256*256的圖片，那麽通過剪切你可以在每張圖片上得到32*32=1024張224*224的圖片，然後再做一次水平翻轉，那麽你的數據集就擴大了2048倍，也就是說你現在有了一個20480張圖片的數據集。看起來很誘人。那麽它的效果如何呢？

（雷鋒網註: 幾何變換不改變像素值, 而是改變像素所在的位置. 通過Data Augmentation方法擴張了數據集的範圍, 作為輸入時, 以期待網絡學習到更多的圖像不變性特征。）

近期加拿大多倫多大學的Salehinejad等人在論文（ arXiv:1708.04347v1 ）中提出了另外一種不同於上面幾種的數據增強變換—— 極坐標變換，方法極為簡單，完全可以作為數據增強變換一個案例來介紹。

所謂極坐標變換，就是像素由原來（x, y）的表示通過極坐標變換得到（r, θ）的表示，然後把它表示成一個二維圖片。數學知識只涉及這兩個高中的數學公式：

用圖來表示就是：

例如在一張256*256的圖片上，選擇圓心任意、半徑為256且等分為256條像素輻條（角度變化為2*pi/256）的圓盤來覆蓋圖片，那麽覆蓋到像素都將對應一個（r, θ）對，放到二維直角坐標系中就生成了一幅新圖。由於極坐標在靠近圓心位置像素粒度較大，而遠離圓心位置的像素粒度較小，所以改變圓心位置，將得到不同的圖片。