核心概念
本研究では、乳がん検出のための大規模スクリーニングマンモグラムデータセットを活用する新しい手法を提案する。このデータセットには、一部の画像が完全にアノテーションされ、他の一部が弱教師付きのアノテーションしか持っていない不完全なアノテーションが含まれている。提案手法は、この不完全なアノテーションを効果的に活用し、最先端の乳がん検出精度を達成する。
要約
本研究は、乳がん検出のための大規模スクリーニングマンモグラムデータセットの分析に取り組んでいる。通常、このようなデータセットには、一部の画像が完全にアノテーションされ(病変の位置と分類が明示されている)、他の一部が弱教師付きのアノテーション(画像全体の分類のみ)しか持っていない不完全なアノテーションが含まれている。
提案手法は2段階のアプローチを取る:
事前学習段階では、弱教師付きの分類タスクを用いて、特徴抽出器と粗い検出器を学習する。
学生-教師型の半教師付き学習段階では、完全アノテーションと弱アノテーションのデータを組み合わせて、より精度の高い検出器を学習する。ここでは、教師の検出結果と事前学習で得られたGradCAMによる検出結果を活用して、弱アノテーションデータの擬似ラベルを生成する。また、教師モデルのパラメータは指数移動平均を用いて更新し、バッチノーマライゼーションの統計量を固定することで、学生-教師間のパラメータ不整合を軽減する。
提案手法は、2つの大規模な実世界のマンモグラムデータセットで評価され、不完全アノテーションを持つ環境下でも最先端の乳がん検出精度を達成している。
統計
乳がん検出の精度を示す指標として、平均精度(mAP)と自由反応特性曲線(FROC)を使用している。