核心概念
本文提出了一種名為 CAT 的新型雙提示醫學影像分割模型,該模型協調解剖學提示(從 3D 圖像中裁剪)和富含醫學領域知識的文本提示,以提高分割精度,特別是在處理腫瘤等醫學圖像中的異常情況時。
研究目標:
本研究旨在開發一種可提示分割模型,利用視覺和文本提示的優勢,無需人工干預,目標是為醫學專業人員提供全自動模型,以解決醫學圖像分割中存在的挑戰,特別是在分割腫瘤等異常情況時,這些異常情況在形狀、大小和外觀上可能差異很大。
方法:
研究提出了一種新的雙視角提示方案,稱為 CAT(協調解剖學和文本提示)。
解剖學提示:直接使用從解剖結構派生的裁剪體積作為視覺提示,旨在以更直觀和視覺連貫的方式表示目標對象。
文本提示:使用更全面的知識增強文本提示,並結合醫學領域知識。
CAT 模型採用了通用的基於查詢的編碼器-解碼器架構,並具有查詢和提示之間的複雜交互範例,旨在預測腹部 N 個類別。其主要組成部分包括:
視覺骨幹網絡:用於提取圖像特徵並構建像素嵌入圖。
提示編碼器:用於分別編碼用戶提供的解剖學和文本提示。
共享優化器:用於優化分割查詢和提示查詢。
提示參考:生成用於預測的目標查詢。
主要發現:
CAT 在腹部 10 個公開 CT 數據集的組合上進行訓練,在多項分割任務中表現出卓越的性能。
在包含四個癌症階段的內部數據集上的進一步驗證表明,CAT 在分割多個癌症階段的腫瘤方面具有顯著的能力。
消融分析表明,解剖學和文本提示起著互補的作用。
主要結論:
協調多模態提示是解決醫學領域複雜場景的一種有前途的方法。將解剖學提示與醫學領域知識相結合是解決醫學領域複雜場景的另一種方法。
意義:
這項工作為醫學圖像分割提供了新的思路,特別是在處理腫瘤等醫學圖像中的異常情況時,協調解剖學和文本提示可以顯著提高分割精度。
局限性和未來研究方向:
缺乏通用的解剖學提示編碼器。
在測試樣本包含罕見類型的病變或進行過導致解剖結構發生巨大變化的根治性切除手術時,分割結果可能存在錯誤。
未來需要進一步研究改進 CT 基礎模型,並制定相關法律法規,以確保將這些基於 AI 的算法整合到臨床實踐中時有明確的指導方針和標準。
統計資料
CAT 在分割胰腺腫瘤方面,DSC 提高了 5%。
CAT 在 T4 腫瘤中優於其他模型至少 7% 的 DSC,平均而言優於其他模型 3% 的 DSC。
僅使用文本提示的食道分割性能降低了 6%,肝血管腫瘤分割性能降低了 4%。