騰訊優圖開源業界首個3D醫療影像大數據預訓練模型MedicalNet
雷鋒網 (公眾號:雷鋒網) AI 開發者按:近日,騰訊優圖首個醫療 AI 深度學習預訓練模型 MedicalNet ( https://github.com/Tencent/MedicalNet )正式對外開源,這也是全球第一個提供多種 3D 醫療影像專用預訓練模型的項目。
MedicalNet具備以下特性:
-
MedicalNet 提供的預訓練網絡可遷移到任何 3D 醫療影像的 AI 應用中,包括但不限于分割、檢測、分類等任務;
-
尤其適用小數據醫療影像 AI 場景,能加快網絡收斂,提升網絡性能;
-
通過簡單配置少量接口參數值,即可進行微調訓練;
-
項目提供多卡訓練以及測試評估代碼,接口豐富,擴展性強;
-
提供不同深度 3D ResNet 預訓練模型,可供不同數據量級應用使用。
為了產生 3D 醫療影像的預訓練模型,MedicalNet 聚集多個來自不同 3D 醫療領域的語義分割小規模數據集,并提出了基于多分支解碼器的多域聯合訓練模型來解決數據集中的標注缺失問題。
整個系統的工作流程如下圖所示:
騰訊團隊將 MedicalNet 模型遷移到預訓練時未接觸過的 Visceral 和 LIDC 數據集中,完成全新的肺部分割和肺結節分類任務,并與目前常用的從零訓練(train from scratch)以及 Kinetics 視頻 3D 預訓練模型在性能以及收斂速度上做了比較。
在肺部分割應用上,相比于 Train from Scratch,MedicalNet 在 Dice 上有 16% 到 33% 幅度的提升,相比于 Kinetics 有 4% 到 7% 幅度的提升。在肺結節良惡性分類應用上,相比于 Train from Scratch,MedicalNet 有 6% 到 23% 幅度的預測正確率(Acc)提升,相比于 Kinetics 有 7% 到 20% 幅度的提升。
在收斂速度上,實驗證明,無論是在肺分割任務還是肺結節分類任務上,MedicalNet 均能為模型提供一個較低的初始化損失值,明顯加快損失下降速度,下圖為 MedicalNet 性能的一個簡單示例,展示了在全器官分割應用中,不同預訓練方式在一定訓練迭代次數下的測試結果。可以看出,基于騰訊預訓練模型(MedicalNet)的結果最接近標簽(ground truth),且遠優于從零訓練(train from scratch)的結果。
更多細節請參考論文:Transfer Learning for 3D Medical Image Analysis(arXiv preprint arXiv:1904.00625 (2019).
雷鋒網版權文章,未經授權禁止轉載。詳情見。