Conceitos Básicos
本文評估了 SAM 家族模型在零樣本學習設定下對斷層掃描影像進行骨骼分割的能力,發現基於邊界框的提示策略表現最佳,並提供初步的二維非迭代提示策略指南。
Resumo
論文資訊
Magg, C., Kervadec, H., & Sánchez, C. I. (2024). Zero-shot capability of SAM-family models for bone segmentation in CT scans. arXiv preprint arXiv:2411.08629v1.
研究目標
本研究旨在評估 Segment Anything Model (SAM) 家族模型在零樣本學習設定下,對電腦斷層掃描 (CT) 影像進行骨骼分割的能力。
研究方法
- 本研究使用一個包含 80 個 CT 掃描的私有數據集,涵蓋肩部、手腕和膝蓋三個骨骼區域。
- 評估了四種 SAM 家族模型:SAM、SAM2、Med-SAM 和 SAM-Med2D,並測試了 32 種非迭代提示策略,包括單一類型提示(邊界框、中心點、質心、正樣本點)、邊界框加點組合提示和基於點的組合提示。
- 使用 Dice 相似係數 (DSC) 和 95% 豪斯多夫距離 (HD95) 作為評估指標,並測量模型推理時間。
主要發現
- 基於邊界框的提示策略表現最佳,無論是單獨使用還是與點提示結合使用。
- 在不同模型和數據集中,表現最佳的提示策略都是基於邊界框的。
- 對於 SAM2 模型(SAM2 T 除外),最佳點組合是中心點加 5 個負樣本點;對於 SAM 模型,最佳點組合是 5 個正樣本點和負樣本點。
- 最佳的單一類型點提示對於 SAM2 模型(SAM2 T 除外)是 5 個正樣本點,對於 SAM 模型是 10 個正樣本點。
- 表現最差的提示策略是質心點。
主要結論
SAM 家族模型在零樣本學習設定下對 CT 影像進行骨骼分割具有潛力,基於邊界框的提示策略表現最佳。
研究意義
本研究為 SAM 家族模型在臨床環境中用於骨骼分割提供了有價值的見解和初步指南。
研究限制與未來方向
- 私有數據集規模較小,未來將擴展數據集以包含更多骨骼區域。
- 未考慮人為標註錯誤和交互式提示策略的影響,未來將探討這些因素。
- 未評估三維提示策略,未來將針對具有三維能力的模型進行測試。
Estatísticas
數據集包含 80 個 CT 掃描,涵蓋肩部、手腕和膝蓋三個骨骼區域。
測試了 32 種非迭代提示策略。
使用 Dice 相似係數 (DSC) 和 95% 豪斯多夫距離 (HD95) 作為評估指標。
Sam B with bounding box + center 5C 的平均 DSC 最高,為 92.5%,HD95 為 1.7 毫米。
Sam L with bounding box + center 1C 的 HD95 最低,為 1.1 毫米,DSC 為 92.1%。
258 種方法中有 59 種的 DSC 高於 91%,其中 28 種是 SAM 方法,31 種是 SAM2 方法。
43 種方法的 HD95 低於 2 毫米,其中 23 種是 SAM 方法,20 種是 SAM2 方法。
Citações
"Our results show that the best settings depend on the model type and size, dataset characteristics and objective to optimize."
"Overall, Sam and Sam2 prompted with a bounding box in combination with the center point for all the components of an object yield the best results across all tested settings."
"As the results depend on multiple factors, we provide a guideline for informed decision-making in 2D prompting with non-interactive, “optimal” prompts."