騰訊推全球首款醫療AI開源模型!讓3D醫療影像應用效能提升33%
智東西(公眾號:zhidxcom)文| 李水青
智東西8月7日訊息,騰訊優圖首個醫療AI深度學習預訓練模型MedicalNet正式對外開源。據稱,這是全球第一個提供多種3D醫療影像專用預訓練模型的專案,將為全球醫療AI發展提供基礎。
許多研究表明,深度學習的發展非常依賴資料量。自然影象領域中存在著許多海量資料集,如ImageNet,MSCOCO。基於這些資料集產生的預訓練模型推動了分類、檢測、分割等應用的進步。
不同於自然影象,醫療影像大部分都是3D結構形態的,同時,由於資料獲取和標註難度大,資料量稀少,目前尚未存在海量資料集及對應的預訓練模型。
一、為3D醫療影像AI應用 “打地基”
MedicalNet是由騰訊優圖開發的一系列預訓練模型,在深度學習應用基礎上開發而成,專用於3D醫療影像。據稱,MedicalNet可以為任何3D醫療影像AI應用起到“打地基”的作用,加快模型收斂,減輕模型對資料量的依賴。
據瞭解,MedicalNet具備以下特性:
1、MedicalNet提供的預訓練網路可遷移到任何3D醫療影像的AI應用中,包括但不限於分割、檢測、分類等任務;
2、尤其適用小資料醫療影像AI場景,能加快網路收斂,提升網路效能;
3、通過簡單配置少量介面引數值,即可進行微調訓練;
4、專案提供多卡訓練以及測試評估程式碼,介面豐富,擴充套件性強;
5、提供不同深度3D ResNet預訓練模型,可供不同資料量級應用使用。
二、應對標註缺失,效能及收斂速度最高提升33%
為了產生3D醫療影像的預訓練模型,MedicalNet聚集多個來自不同3D醫療領域的語義分割小規模資料集,並提出了基於多分支解碼器的多域聯合訓練模型來解決資料集中的標註缺失問題。據稱,該團隊的預訓練模型可以遷移到任何3D醫療影像應用的深度學習模型中。整個系統的工作流程如下圖所示:
▲MedicalNet系統的工作流程
該團隊將MedicalNet模型遷移到預訓練時未接觸過的Visceral和LIDC資料集中,完成全新的肺部分割和肺結節分類任務,並與目前常用的從零訓練(train from scratch)以及Kinetics視訊3D預訓練模型在效能以及收斂速度上做了比較。
據稱,在肺部分割應用上,相比於Train from Scratch,MedicalNet在Dice上有16%到33%幅度的提升,相比於Kinetics有4%到7%幅度的提升。在肺結節良惡性分類應用上,相比於Train from Scratch,MedicalNet有6%到23%幅度的預測正確率(Acc)提升,相比於Kinetics有7%到20%幅度的提升。
在收斂速度上,實驗證明,無論是在肺分割任務還是肺結節分類任務上,MedicalNet均能為模型提供一個較低的初始化損失值,明顯加快損失下降速度,下圖為MedicalNet效能的一個簡單示例,展示了在全器官分割應用中,不同預訓練方式在一定訓練迭代次數下的測試結果。可以看出,基於我們的預訓練模型(MedicalNet)的結果最接近標籤(ground truth),且遠優於從零訓練(train from scratch)的結果,更多細節請參考論文(論文:《Med3D: Transfer Learning for 3D Medical Image Analysis》)。
▲不同預訓練方式在一定訓練迭代次數下的測試結果
三、專有領域,專有模型
隨著人工智慧的火熱化,醫療影像AI也成為了當前各應用領域中最熱門的版塊。區別於其他人工智慧應用,人工智慧在醫療領域的應用門檻最高,最大的原因在於標註資料的匱乏。醫療影像資料的獲取通常需要經歷重重關卡,同時,由於領域的專一性,資料通常需要資深醫師標註,而每個3D資料的標註耗時耗力。在當前緊張的醫護資源下,醫療影像資料的獲取戰線將非常漫長,大大阻礙了應用落地的程序。再者,標註資料量相當有限,大部分醫療部門都需要面臨資料量稀少和深度學習之間的鴻溝。
專有領域專有模型,MedicalNet相當於為各個3D醫療影像應用準備了具備臨床通用知識的資料庫。即使在小資料量中,該資料庫的有效特徵也能幫助落地應用取得較好的醫療檢測效能,這大大減輕醫療影像AI應用對資料量的依賴,實現了落地需求,加快了落地速度。
結語:騰訊已有81個開源專案,將持續發力醫療AI領域
截至2019年8月,騰訊已在Github上釋出81個開源專案,包含騰訊AI、微信、騰訊雲、騰訊安全等相關領域,並累計在 Github 獲得了超過23萬Star數,在國內和國際收穫了關注和認可。