深度學習 | 反捲積/轉置卷積的理解 transposed conv/deconv

搞明白了卷積網路中所謂deconv到底是個什麼東西后，不寫下來怕又忘記，根據參考資料，加上我自己的理解，記錄在這篇部落格裡。

先來規範表達

為了方便理解，本文出現的舉例情況都是2D矩陣卷積，卷積輸入和核形狀都為正方形，x和y軸方向的padding相同，stride也相同。
記號：
$i, o, k, p, s$ 分別表示：卷積/反捲積的輸入大小 $i n p u t s i z e$ ，卷積/反捲積輸出大小 $o u t p u t s i z e$ ，卷積/反捲積核大小 $k e r n e l s i z e$ ， $p a d d i n g$ ， $s t r i d e$ 。
舉例（如下左圖）：
輸入 $X \in R^{(4, 4)}$ 矩陣，卷積核 $w \in R^{(3, 3)} ， p a d d i n g = 0 ， s t r i d e = 1$ 的情況下，卷積的輸出 $Y \in R^{(2, 2)}$ ，就記為 $i = 4, o = 2, k = 3, p = 0, s = 1$ 。

推翻錯誤的理解

第一次看到deconv這個詞，以為deconv的結果就是卷積的逆，覺得神奇，不禁產生了“哦？轉置的卷積就可以求逆了嗎？”這樣的想法，然後在matlab裡面實驗求證，我還記得當時以為反捲積能夠求逆，考慮到圖片進行常規卷積操作輸出大小又不可能變大（same/valid），於是我還假設反捲積輸出大小不變，用了same padding和原核的轉置作為反捲積配置，結果發現根本不是那麼一回事好嗎。
其實DL中的deconv，是一種上取樣過程，舉個比方：輸入 $X \in R^{(4, 4)}$

X \in R^{(4, 4)}

矩陣，卷積核

w \in R^{(3, 3)} ， p a d = 0 ， s t r i d e = 1

的情況下（如下左圖），卷積的輸出

Y \in R^{(2, 2)}

。對

Y

進行deconv，它只能做到把還原輸出大小到和

X

一樣大，輸出值和

X

有那麼一點聯絡。
所以啊deconv這個名字相當誤導人吶！這在cs231n課程裡也被吐槽過，大家現在更喜歡用transposed conv來表述反捲積。為了方便起見，後文就用反捲積這個詞了。

第二個容易confused的地方，就是很多文章都說卷積核的轉置就可以求反捲積，又陷入迷茫“就算把卷積核轉置（或者左右翻轉上下翻轉），卷積後輸出還是越來越小（或不變，至少不會增大）啊

”……直到看到文獻和相應的這個動畫（其他動畫在github-convolution arithmetic1）

$卷積 $\ padding=0,stride=1$$	$反捲積$\ padding=0,stride=1$$
卷積 $i = 4, k = 3, p = 0, s = 1, 则 o = 2$	反捲積 $i = 2, k = 3, p = 0, s = 1, 则 o = 4$

注意圖中藍色（下面）是輸入，綠色（上面）是輸出，卷積和反捲積在 $p 、 s 、 k$ 等引數一樣時，是相當於 $i$ 和 $o$ 調了個位。
這裡說明了反捲積的時候，是有補0的，即使人家管這叫no padding（ $p = 0$ ），這是因為卷積的時候從藍色 $4 \times 4$ 縮小為綠色 $2 \times 2$ ，所以對應的 $p = 0$ 反捲積應該從藍色 $2 \times 2$ 擴充套件成綠色 $4 \times 4$ 。而且轉置並不是指這個 $3 \times 3$ 的核 $w$ 變為 $w^{T}$ ，但如果將卷積計算寫成矩陣乘法（在程式中，為了提高卷積操作的效率，就可以這麼幹，比如tensorflow中就是這種實現）， $\vec{Y} = C \vec{X}$

深度學習 | 反捲積/轉置卷積的理解 transposed conv/deconv

先來規範表達

推翻錯誤的理解

深度學習 | 反捲積/轉置卷積的理解 transposed conv/deconv

反捲積逆卷積轉置卷積(Transposed Convolution；Fractionally Strided Convolution；Deconvolution) 輸出維度shape計算

深度學習中反捲積層(轉置卷積)引起的棋盤格噪聲

對深度可分離卷積、分組卷積、擴張卷積、轉置卷積（反捲積）的理解

[轉載]對深度可分離卷積、分組卷積、擴張卷積、轉置卷積（反卷積）的理解

輕鬆理解轉置卷積(transposed convolution)/反捲積(deconvolution)

轉置卷積(反捲積)

卷積神經網路CNN（1）——影象卷積與反捲積（後卷積，轉置卷積）

反捲積（轉置卷積）總結

卷積、反捲積、轉置卷積和微步幅卷積

反捲積（轉置卷積）

[深度學習]轉置卷積(Transposed Convolution)

對深度可分離卷積、分組卷積、空洞卷積、轉置卷積的理解

【轉置卷積】當想用通過學習來進行上取樣的時候

轉置卷積&&膨脹卷積

轉置卷積的理解

TensorFlow深度學習實戰---圖像識別與卷積神經網絡

深度學習方法（五）：卷積神經網路CNN經典模型整理Lenet，Alexnet，Googlenet，VGG，Deep Residual Learning

由淺入深：CNN中卷積層與轉置卷積層的關系

深度學習：十大拍案叫絕的卷積設計操作

深度學習 | 反捲積/轉置卷積 的理解 transposed conv/deconv

先來規範表達

推翻錯誤的理解

深度學習 | 反捲積/轉置卷積的理解 transposed conv/deconv