Core Concepts
弱教師付セマンティックセグメンテーションにおける曖昧さの問題を、不確実性推論とアフィニティ多様化の観点から効率的に解決する。
Abstract
本研究は、弱教師付セマンティックセグメンテーション(WSSS)における曖昧さの問題に取り組む。WSSS は画像レベルのラベルを使用して密な分割タスクを達成しようとするが、曖昧なコンテキストと不明瞭な領域のため、特に Class Activation Maps (CAMs) の生成と疑似マスクの精製の段階で、曖昧さに起因する問題が深刻化している。
提案手法UniAは、この問題に対して、不確実性推論とアフィニティ多様化の観点から効率的に取り組む。CAMを生成する際、モデルが曖昧な領域に偏りやすいことから、不確実性推定を導入し、特徴表現をロバスト化する。また、疑似ラベルの精製段階では、従来の手法のアフィニティが曖昧な領域間で類似しがちであることに着目し、アフィニティの多様性を促進する手法を提案する。
実験では、PASCAL VOC、MS COCO、医療ACDC データセットで評価を行い、UniAが曖昧さに効果的に対処し、最新の単一段階および多段階の手法を上回る性能を示すことを確認した。
Stats
曖昧な領域に偏りやすいため、モデルの予測が異なる推論間で大きく変動する。
従来のアフィニティ精製手法では、曖昧な領域間のアフィニティが類似しがちで、ノイズの伝播を招く。
Quotes
曖昧な文脈と不明瞭な領域のため、特にCAMの生成と疑似マスクの精製の段階で、WSSS の性能が広く低下している。
曖昧さに起因する誤推定の問題は、単に共起頻度の高さだけでなく、類似のテクスチャや色を持つ非対象物によっても引き起こされる。