核心概念
提案手法は、敵対的消去とプセウドラベルを活用することで、従来手法よりも高精度な物体検出を実現する。
要約
本論文は、画像レベルのクラスラベルのみを使用して物体の位置と種類を予測する弱教師付き物体検出手法を提案している。提案手法は、特徴抽出器、分類器、位置推定器の3つのモジュールから構成される。
提案手法の特徴は以下の通りである:
敵対的消去を2種類適用することで、最も識別的な領域への依存を減らし、物体全体の領域を活性化するように学習する。一つは分類器の出力スコアマップに適用し、もう一つは前景マスクに適用する。
プセウドラベルを生成し、背景を抑制しつつ前景領域の活性化を促進するための損失関数を導入する。
分類と位置推定の両方の損失関数を組み合わせて最適化することで、高精度な物体検出を実現する。
提案手法は、MobileNetV1およびInceptionV3のバックボーンネットワークを用いて、ILSVRC-2012、CUB-200-2011、PASCAL VOC 2012の3つのデータセットで評価された。実験結果より、提案手法が従来手法を上回る性能を示すことが確認された。
統計
物体検出の精度は、Top-1で53.74%、Top-5で67.11%、GT-knownで72.31%を達成した。
平均IoUは46.66%であり、従来手法よりも0.03%高い。
引用
"弱教師付き学習アプローチは、ニューラルネットワークの学習に必要な人手による注釈の労力を削減できるため、大きな注目を集めている。"
"提案手法は、敵対的消去とプセウドラベルを活用することで、物体全体の領域を正確に検出することができる。"