Core Concepts
本研究では、テキストプロンプトを使用して、さまざまな医療画像モダリティ、解剖学的領域、病変に対応できる汎用セグメンテーションモデルを提案する。
Abstract
本研究では、医療画像セグメンテーションの汎用モデルの構築を目指している。従来の専門化されたモデルとは異なり、本手法は、テキストプロンプトを使用して、さまざまな医療画像モダリティ、解剖学的領域、病変に対応できる。
具体的な貢献は以下の3点:
データセット構築: 複数の知識源を組み合わせて、人体解剖に関する最初の多モーダルな知識ツリーを構築した。また、72の公開セグメンテーションデータセットから22,000以上の3D医療画像スキャンと302,000以上の注釈を収集し、最大かつ最包括的なセグメンテーションデータセットを構築した。
アーキテクチャ設計: 医療用語をテキスト入力として受け付ける汎用セグメンテーションモデルを提案した。大量のデータセットを組み合わせた知識強化表現学習を行っている。
モデル評価: 72の異なるセグメンテーションデータセットに対して、447Mパラメータの「SAT-Pro」モデルを用いて、497クラスのセグメンテーションを行った。体領域別、クラス別、データセット別の3つの観点から評価し、72の専門家用nnU-Netモデルと同等の性能を示した。
Stats
医療画像スキャン数: 22,186
セグメンテーション注釈数: 302,033
セグメンテーションクラス数: 497
Quotes
"従来の専門化されたモデルとは異なり、本手法は、テキストプロンプトを使用して、さまざまな医療画像モダリティ、解剖学的領域、病変に対応できる。"
"本研究では、医療画像セグメンテーションの汎用モデルの構築を目指している。"