深度學習 & 青光眼
公眾號/將門創投
來源:IBM Research Blog 編譯:Lin
青光眼是世界上導致失明的第二大原因。僅在美國,這一病症就影響了約270萬人。它是一種複雜的疾病,如果不及時治療可能導致失明。這在澳大利亞也是個特別嚴重的問題,其中只有50%的人被確診為青光眼並接受相應的治療。
目前,IBM和紐約大學科學家團隊正在研究,可以利用深度學習來幫助眼科醫生和驗光師進一步檢測眼部影象的新方法,這一方法也可有助於加快在影象中檢測青光眼的過程。
在最近的一篇論文中,研究人員詳細介紹了一種 新的深度學習框架 ,該框架直接從原始光學相干斷層掃描(OCT)成像中檢測青光眼,這種方法利用的是光波拍攝視網膜的橫截面影象。該方法達到了94%的準確率,且無需對資料進行任何額外的分割或清理——通常在傳統的方法中這一步驟通常非常耗時。
青光眼(頂行)和健康眼(底行)中網路檢測區域的視覺化
現在,人們使用各種測試方法來診斷青光眼,例如眼壓測量和視野測試、眼底和OCT成像。但OCT提供了一種有效的方法來視覺化和量化眼睛中的結構,即視網膜神經纖維層(RNFL),它隨著疾病的進展而變化。
雖然這種方法效果良好,但它需要額外的過程來量化OCT影象中的視網膜神經纖維層。這些技術通常需要配合各種方式來對輸入資料進行處理,例如將所有眼睛圖片翻轉到相同的方向(左或右)以減少資料的可變性,從而改善分類器的效能。而研究人員新提出的方法消除了這些額外的步驟,保留了檢測中最重要的部分。
在624名受試者(217名健康受試者和432名青光眼患者)中,研究人員建立了利用深度學習進行檢測的新方法,準確地檢測出了94%的青光眼患者,而之前提到的技術僅發現了86%的患者。研究人員表示準確性的提升是由於對影象中結構自動分割錯誤的消除,以及新方法包含了目前臨床上尚未使用的眼底特徵進行了分類。
此外,與目前使用更大更深層網路的人工智慧研究趨勢相反,研究人員使用的網路是一個小型的5層網路,這主要是由於醫療資料由於其隱私性不易獲取。這種資料稀缺使得大型網路的使用在許多醫療應用中不切實際。即使在研究中有時也會看到“越少越佳”的特點,此外,在較小的網路上訓練這些演算法可以讓它們更高效地執行。
資料被輸入如下圖所示的卷積神經網路(CNN)。網路由5個3D卷積層組成,並使用ReLU啟用和批量歸一化,濾波器組大小為32-32-32-32-32,濾波器尺寸為7-5-3-3-3,步幅為2-1-1-1-1。在最後的卷積層之後採用全域性平均合併,並利用全連線的softmax輸出層以實現類標籤的預測和類啟用圖(CAM)的計算。網路架構的一個重要方面是選擇3D卷積以允許計算3D類啟用圖。卷積神經網路的5個輸入層沿第一維度(例如,顏色通道)聚合輸入資料。在2D卷積的情況下,所得到的類啟用圖將是2D的,且深度資訊丟失。因此通過採用3D卷積,這使我們能夠識別光學相干斷層掃描體積內對疾病分類很重要的區域。
通過隨機超引數探索優化了網路體系結構的各個方面,例如層數、每層濾波器組數、濾波器大小、步幅和批量歸一化的使用;類似於為基於特徵的方法執行的超引數優化。網路實現的曲線下面積用於選擇最佳網路。研究人員從網路架構搜尋中排除了最大池化,因為它可以被stride卷積取代。
卷積神經網路在Keras中實現,Tensorflow作為後端。使用nut-flow/ml進行資料分離、分層和預處理。通過降取樣,每個階段對資料進行分層。通過隨機遮擋、平移、左右眼翻轉、沿著表面軸的小旋轉(±10度)和混合來增強訓練資料。同時研究人員還在沒有任何擴充的情況下訓練了網路,並報告了相應的曲線下面積。在訓練期間具有最高準確度的曲線下面積的網路被儲存。
這只是IBM目前研究應用人工智慧的一個方面。在最近宣佈的新合作中,IBM Research和George&Matilda (G&M) 將利用G&M強大的匿名臨床資料和成像研究資料集,來探索使用深度學習模型和成像分析的方法,以支援臨床醫生在影象中識別和檢測眼部疾病——包括青光眼。研究人員還將研究青光眼的潛在生物標誌物,這有助於更好地瞭解疾病進展。