Conceitos essenciais
大規模な基礎モデルを活用し、ユーザーが1つのプロンプト画像を提示するだけで、様々な医療画像を自動的にセグメンテーションできる新しい手法を提案する。
Resumo
本論文は、医療画像セグメンテーションの新しいパラダイムとして「ワンプロンプトセグメンテーション」を提案している。
- 従来の医療画像セグメンテーションは、各タスクに合わせてモデルを個別に訓練する必要があった。また、対話型セグメンテーションモデルでは、各画像にプロンプトを与える必要があり、時間がかかる。
- 本手法では、大規模な基礎モデルを事前に訓練し、ユーザーが1つのプロンプト画像を提示するだけで、様々な医療画像を自動的にセグメンテーションできる。
- 提案手法の中核となる「ワンプロンプトフォーマー」モジュールは、プロンプト特徴量とクエリ画像特徴量を効果的に融合する。また、4種類のプロンプト(クリック、バウンディングボックス、落書き、セグメンテーションラベル)に対応し、ユーザーの使い勝手を向上させている。
- 78の医療画像データセットを収集し、64データセットで事前訓練を行った。14の未知のデータセットで評価した結果、従来手法を大きく上回る性能を示した。
Estatísticas
医療画像セグメンテーションタスクを扱う78のオープンソースデータセットを収集した。
3,000以上の画像に対して、医療専門家によるプロンプトアノテーションを行った。
Citações
"大規模な基礎モデルは、ゼロショット汎化能力に優れ、視覚・言語アプリケーションで優れた成果を上げている。しかし、多様な撮像モダリティと対象ラベルを持つ医療画像セグメンテーションへの適用は未解決の課題である。"
"ワンプロンプトセグメンテーションは、ワンショットと対話型手法の長所を組み合わせた新しいパラダイムである。推論時に、ユーザーが1つのプロンプト画像を提示するだけで、未知のタスクに適応できる。"