本論文は、画像レベルのクラスラベルのみを使用して物体の位置と種類を予測する弱教師付き物体検出手法を提案している。提案手法は、特徴抽出器、分類器、位置推定器の3つのモジュールから構成される。
提案手法の特徴は以下の通りである:
敵対的消去を2種類適用することで、最も識別的な領域への依存を減らし、物体全体の領域を活性化するように学習する。一つは分類器の出力スコアマップに適用し、もう一つは前景マスクに適用する。
プセウドラベルを生成し、背景を抑制しつつ前景領域の活性化を促進するための損失関数を導入する。
分類と位置推定の両方の損失関数を組み合わせて最適化することで、高精度な物体検出を実現する。
提案手法は、MobileNetV1およびInceptionV3のバックボーンネットワークを用いて、ILSVRC-2012、CUB-200-2011、PASCAL VOC 2012の3つのデータセットで評価された。実験結果より、提案手法が従来手法を上回る性能を示すことが確認された。
翻譯成其他語言
從原文內容
arxiv.org
深入探究