Core Concepts
本研究では、2Dエンコーダを用いて3D医用画像の密な予測タスクを実行する新しい手法ToNNOを提案する。弱教師付き分類タスクでエンコーダを訓練した場合、提案手法はクラスアクティベーションマッピング(CAM)手法よりも優れた結果を達成できることを示す。さらに、CAM手法をToNNOフレームワークに統合したAveraged CАMとTomographic CАMを提案し、より良い結果を得ることができる。
Abstract
本研究の目的は、3D医用画像の領域セグメンテーションを行うことである。特に、手動でセグメンテーションマスクを作成するのが時間がかかる3D医用画像に対して、画像レベルのラベルのみを使用して訓練できる弱教師付きセグメンテーション手法を提案する。
提案手法の概要は以下の通り:
- 2Dエンコーダ(ResNetなど)を用いて、3D画像のスライスが領域を含むかどうかを分類する。
- 異なる角度から抽出した3Dスライスをエンコーダに入力し、その出力を逆ラドン変換することで3Dヒートマップを再構成する(ToNNO)。
- さらに、クラスアクティベーションマッピング(CAM)手法をToNNOフレームワークに統合したAveraged CАMとTomographic CАMを提案する。
提案手法は、4つの大規模な医用画像データセットで評価され、従来のCAM手法を大幅に上回る結果を示した。特に、Tomographic CАMは最も優れた性能を発揮した。
Stats
3D医用画像から抽出した2Dスライスの中で、領域を含むスライスの平均ロジット値は8.0、含まないスライスの平均ロジット値は-2.0である。
特定の3D画像の垂直方向のロジットプロファイルから、腫瘍の位置を特定できる。
Duke データセットの腫瘍領域のIoUは0.42である。
Quotes
"ToNNOは、2Dエンコーダを用いて3D画像の密な予測タスクを実行できる汎用的な手法である。"
"Tomographic CАMは、最も優れた性能を発揮し、従来のCAM手法に比べて平均F1スコアで0.14の改善を達成した。"
"提案手法は、大規模な医用画像データセットで評価され、優れた結果を示した。"