1. 程式人生 > >Machine learning for improved image-based wavefront sensing

Machine learning for improved image-based wavefront sensing

均方誤差 多個 nms ear 誤差 隨機選擇 公司 選擇 標準

---恢復內容開始---

  基於圖像的波前傳感是一種利用參數化物理模型和非線性優化計算點擴散函數(Psf)來測量波前誤差的方法。當執行基於圖像的波前傳感時,探測器上捕獲一個psf,物理模型創建一個波前,生成一個模擬psf,與優化後的數據相匹配。一個很好的策略是用多項式(如Zernike多項式)對波前進行參數化,從而降低維數,並強制物理上適合於平滑變化的波前。為了確定這些多項式的系數來重建波前,可以采用基於梯度的非線性優化方法來調整系數值。為了確定這些多項式的系數來重建波前,可以采用基於梯度的非線性優化方法來調整系數值。基於梯度的優化器使用從成本函數的梯度計算出的搜索方向將成本函數相對於未知參數集的代價函數最小化。在本文中,代價函數是一個增益和偏差不變的歸一化均方誤差(Nmse)度量。基於梯度的優化器將調整多項式基的系數,直到誤差度量值或梯度值的變化足夠小為止。

  非線性優化算法可以停滯在局部極小,梯度為零。在局部極小的情況下,計算的psf與數據不一致,除了極少數的模糊情況外,它是局部最小的。為了避免局部極小的停滯,在波前誤差較大時,需要附加信息,如離焦平面或光滑性知識,或對多項式系數進行良好的起始估計。當初始猜測與真實解不夠接近時,在局部極小處停滯的可能性稱為“捕獲範圍問題”,而起始估計與真正解的距離足夠接近收斂的距離稱為“捕獲範圍”。可以通過估計均方根波前誤差(Rms Wfe)和使用與rms wfe相同數量的多個隨機開始猜測來執行全局優化,以便隨機選擇一個足夠接近捕獲範圍內的真正解的起始估計值。

  為了在給定的psf捕獲範圍內生成初始估計值,我們轉向機器學習和神經網絡。神經網絡以前曾被應用於相位恢復,試圖恢復Zernike系數。那次嘗試使用一個網絡,將psf的每個像素作為輸入向量的一部分,這是矩陣乘以一個單一的“隱藏”向量,然後通過非線性乙狀函數和矩陣乘以澤尼克多項式系數對應的輸出向量。   

技術分享圖片

由於我們已經使用物理模型來描述光在強度平面上的傳播和探測,我們可以簡單地根據Zernike系數創建模擬psfs並將其輸入CNN。這種方法假設我們的模型中有已知的值,如瞳孔振幅、f數和像素間距。對於我們的情況,我們考慮一個均勻照明的JWST孔徑,如圖所示。它是陣列中的零填充,是光圈寬度的兩倍,從而產生一幅nquist采樣的psf(圖像)。我們基於二階至五階全局Zernike多項式產生psfs,不包括任何每段誤差。在輸入cnn之前,所有psfs都被標準化為最大值為1。我們用minibatch訓練與16 PSFS minibatch大小。cnn的學習參數通過每次CNN操作使用反向傳播梯度來更新。小批訓練根據來自一小批輸入的梯度更新CNN的參數,而不僅僅是單個輸入,這提高了收斂速度[18]。機器學習依賴隨機梯度下降算法,其中更新是基於梯度和一個稱為學習速率的參數。學習速率控制更新的步長,較小的學習速率表示在參數空間中的較小移動。為了最小化,我們使用adam,一種基於梯度的隨機優化算法,具有自適應的學習速率,這意味著它被初始化為用戶定義的值,然後根據用戶定義的值進行更新。技術分享圖片

我們最初僅用2.3RMS像差波(相當大的像差)訓練了5000個周期的psfs模型,初始學習速率為2×10?2,每1000個周期減少一半。然後我們允許公司有任何地方從1到4的RMS波像差RMS波和培訓20000時代,開始學習率在1×10?3和降低0.5×10?3後的第一個10000期。最後,我們包括在我們公司,包括泊松噪聲和任選包括探測器的噪聲,背景噪聲,和壞點。一個minibatch這些輸入方式的一個例子,圖3中可以看出。從均勻分布的隨機分布中選取峰值光子和任何附加噪聲參數,表1給出了低值和高值。

技術分享圖片

技術分享圖片

這些噪聲的選擇使我們的cnn對實驗中可以發現的各種各樣的噪聲都有很強的魯棒性,我們在這些噪聲的psfs上訓練了50,000次,從2.5×10?3的學習速率開始,在每10,000次後分別降至1.0×10?3,0.75×10?3,0.5×10?3和0.3×10?3。訓練結束後,我們的驗證損失為預測和真實Zernike系數之間的0.373波均方根差值,剩余RMSWFE在訓練區域內單調增長,如圖所示。技術分享圖片

為了確定CNN預測的有效性,我們使用了蒙特卡羅分析。我們模擬的psfs僅由cnn預測的Zernike系數組成。這些模擬的psfs中的噪聲產生的方式與訓練psfs相同。我們使用了從0.25波到4.0波不等的RMS WFE值,以0.25波為增量。對於每數量的RMS WFE,我們模擬了250種不同的psfs。他的結果是,在我們模擬的檢測器窗口內有一些匹配是正確的,但與上述窗口外的真實psf不同。我們將圖像陣列的大小增加到512×512像素,因為jwst上的檢測器至少是1024×1024像素(23,24)。為了防止出現錯誤,我們將瞳孔域的采樣增加了一倍。我們知道這是合理的,因為jwst上的檢測器至少是1024×1024像素[23,24]。還將psf縮小到256×256像素,然後再輸入cnn。這意味著我們不需要再訓練CNN,可以使用更大的數組進行優化。這些步驟改進了我們分析中的收斂性。

Machine learning for improved image-based wavefront sensing