核心概念
利用預先訓練的視覺基礎模型 SAM2,可以更有效且準確地進行醫學影像轉換,生成具有清晰結構和逼真紋理的目標模態影像。
摘要
論文概述
本論文介紹了一種名為 SAM-I2I 的新型醫學影像轉換框架,該框架利用 Segment Anything Model 2 (SAM2) 進行跨模態磁共振成像 (MRI) 合成。
研究方法
SAM-I2I 框架主要由兩個部分組成:
- 預先訓練的圖像編碼器:源自 SAM2 的 Hiera 模型,用於提取多尺度語義特徵。
- 圖像解碼器:基於掩碼單元注意力模塊,有效地聚合從編碼器獲得的分層特徵,生成目標模態圖像。
實驗結果
在 IXI 數據集上進行的實驗表明,SAM-I2I 在以下幾個方面優於其他圖像轉換方法:
- 定量結果:SAM-I2I 在所有跨模態合成任務中均取得最佳性能,PSNR 指標平均提高 0.26 dB。
- 定性結果:SAM-I2I 生成的目標模態圖像具有清晰的結構和逼真的紋理。
- 消融研究:使用不同圖像編碼器的結果表明,預先訓練的 Hiera 模型非常適合醫學影像轉換。
研究結論
SAM-I2I 框架通過利用視覺基礎模型 SAM2 中編碼的知識,實現了高效準確的醫學影像轉換。預先訓練的 Hiera 圖像編碼器和基於掩碼注意力單元的解碼器設計,使得 SAM-I2I 能夠生成高質量的目標模態圖像。
未來方向
未來研究方向包括:
- 將 SAM-I2I 應用於更廣泛的醫學影像轉換任務,例如 CT-to-MRI 和 PET-to-MRI。
- 研究將 SAM-I2I 擴展到 3D 體積圖像合成的可行性。
統計資料
與 ResViT 相比,SAM-I2I 在四項跨模態合成任務中 PSNR 指標平均提高了 0.26 dB。
IXI 數據集包含 581 名受試者,每位受試者均具有 T1、T2 和 PD 加權 MRI。
每張圖像的空間分辨率為 0.94 × 0.94 × 1.2 mm³。
引述
"Training on such large datasets makes the Hiera image encoder have strong feature representations."
"Our approach SAM-I2I achieves the best performance for all tasks."
"Quantitative results on the IXI dataset demonstrate the superiority of SAM-I2I compared to other image translation methods."