本研究は、弱教師付セマンティックセグメンテーション(WSSS)における曖昧さの問題に取り組む。WSSS は画像レベルのラベルを使用して密な分割タスクを達成しようとするが、曖昧なコンテキストと不明瞭な領域のため、特に Class Activation Maps (CAMs) の生成と疑似マスクの精製の段階で、曖昧さに起因する問題が深刻化している。
提案手法UniAは、この問題に対して、不確実性推論とアフィニティ多様化の観点から効率的に取り組む。CAMを生成する際、モデルが曖昧な領域に偏りやすいことから、不確実性推定を導入し、特徴表現をロバスト化する。また、疑似ラベルの精製段階では、従来の手法のアフィニティが曖昧な領域間で類似しがちであることに着目し、アフィニティの多様性を促進する手法を提案する。
実験では、PASCAL VOC、MS COCO、医療ACDC データセットで評価を行い、UniAが曖昧さに効果的に対処し、最新の単一段階および多段階の手法を上回る性能を示すことを確認した。
Vers une autre langue
à partir du contenu source
arxiv.org
Questions plus approfondies