本論文は、2D自然画像向けに設計されたSegment Anything Model (SAM)を、3D医用画像の腫瘍セグメンテーションに効率的に適応する新しい手法を提案している。
まず、画像エンコーダの設計を見直し、2D画像から3D画像への入力変換を行いつつ、大部分の事前学習パラメータを再利用できるよう工夫している。次に、プロンプトエンコーダでは、位置エンコーディングではなくビジュアルサンプラーを用いることで、3D入力に対する表現力を高めている。さらに、マスクデコーダでは軽量な3D CNNベースの設計とマルチレイヤー集約を導入し、詳細な腫瘍境界の抽出を可能にしている。
実験では、4つの腫瘍セグメンテーションデータセットで評価を行い、従来手法と比較して優れた性能を示している。特に腎臓腫瘍、膵臓腫瘍、大腸がんのセグメンテーションでは、従来手法を大幅に上回る結果を得ている。また、パラメータ効率の高い適応手法としても優れた性能を発揮している。
本手法は、2D自然画像向けの強力なセグメンテーションモデルをドメイン固有の3D医用画像処理に効果的に適応する新しい方法論を示しており、医療画像解析分野への応用が期待される。
إلى لغة أخرى
من محتوى المصدر
arxiv.org
الرؤى الأساسية المستخلصة من
by Shizhan Gong... في arxiv.org 10-03-2024
https://arxiv.org/pdf/2306.13465.pdfاستفسارات أعمق