1. 程式人生 > >神經網絡之模塊化視角(二)

神經網絡之模塊化視角(二)

時間 分享圖片 gen 繼續 mod 社區 類別 多好 lar

我很佩服你的計算方法的優雅; 在真正數學的馬匹上穿越這些領域一定很好,而我們這樣的人必須徒勞無功地走上這條路。- 艾爾伯特愛因斯坦

卷積神經網絡的結果

??早些時候,我們提到最近使用卷積神經網絡的計算機視覺突破。在我們繼續之前,我想簡要地討論一下這些結果作為動機。
?他們的進步是將一堆不同的部分組合在一起的結果。他們使用GPU來訓練一個非常大的深度神經網絡。他們使用了一種新的神經元(ReLUs)和一種新技術來減少一種叫做“過度擬合”的問題(DropOut)。他們使用了一個包含大量圖像類別的非常大的數據集(ImageNet)。當然,它是一個卷積神經網絡。

??他們的建築如下圖所示,非常深刻。它有5個卷積層,有散布的池,以及3個完全連接的層。早期層分為兩個GPU。

技術分享圖片

??他們訓練他們的網絡將圖像分為千種不同的類別。

??隨機猜測,0.1%的時間會猜出正確的答案。Krizhevsky,et al。該模型能夠在63%的時間內給出正確的答案。此外,它給出的前5個答案中的一個是正確的85%的時間!

技術分享圖片
????上:4個正確分類的例子。下圖:4個錯誤分類的例子。每個示例都有一個圖像,後跟其標簽,然後是具有概率的前5個猜測。來自Krizehvsky 等人

??甚至它的一些錯誤對我來說似乎也很合理!我們還可以檢查網絡的第一層學習要做什麽。
??回想一下,卷積層在兩個GPU之間分開。信息不會在每一層上來回傳遞,因此拆分側以實際方式斷開連接。事實證明,每次模型運行時,雙方都會專註。

技術分享圖片
??由第一個卷積層學習的過濾器。上半部分對應於一個GPU上的層,底部對應於另一個GPU上的層。

??一側的神經元聚焦於黑色和白色,學習檢測不同方向和大小的邊緣。另一側的神經元專註於顏色和紋理,檢測顏色對比和圖案。4請記住,神經元是隨機初始化的。沒有人去做它們是邊緣探測器,或者以這種方式分裂。它只是通過訓練網絡來分類圖像而產生的。

??這些顯著的成果(以及當時的其他令人興奮的結果)僅僅是開始。他們很快就接著進行了許多其他測試改進方法的工作,並逐步改進結果,或將其應用於其他領域。並且,除了神經網絡社區之外,計算機視覺社區中的許多人都采用了深度卷積神經網絡。

??卷積神經網絡是計算機視覺和現代模式識別中的重要工具。

形式化卷積神經網絡

考慮具有輸入{\(x_{n}\)}並輸出{\(y_{n}\)}:

技術分享圖片

  • 根據輸入描述輸出相對容易:

| \(y_{n} = A(x_{n},x_{n+},...)\) |
:-:|

  • 例如:

|\(y_{0} = A(x_{0},x_{1})\) |
:-:|

| \(y_{1} = A(x_{1},x_{2})\) |
:-:|

類似地,如果我們考慮一個二維卷積層,輸入{\(x_{n,m}\)}並輸出{\(y_{n,m}\)}

技術分享圖片

我們可以再次根據輸入記錄輸出:

| 技術分享圖片 |
:-:|

  • 例如:

| 技術分享圖片 |
:-:|

如果將其與\(A(x)\)的等式組合
| \(A(x) =\sigma(W_{X} + )\) |
:-:|

??一個人擁有實現卷積神經網絡所需的一切,至少在理論上是如此。

??在實踐中,這通常不是考慮卷積神經網絡的最佳方式。根據稱為卷積的數學運算,有一種替代的公式,通常更有幫助。

??卷積運算是一個強大的工具。在數學中,它出現在不同的語境中,從偏微分方程的研究到概率論。部分由於其在偏微分方程中的作用,卷積在物理科學中非常重要。它在許多應用領域也具有重要作用,如計算機圖形和信號處理。

??對我們來說,卷積將帶來許多好處。首先,它將允許我們創建比天真的觀點所暗示的更有效的卷積層實現。其次,它將從我們的配方中消除很多混亂,處理目前在x的索引中出現的所有簿記s - 目前的表述可能看起來並不淩亂,但這只是因為我們還沒有陷入棘手的情況。最後,卷積將為卷積層的推理提供一個截然不同的視角。

註:本文系翻譯

神經網絡之模塊化視角(二)