Core Concepts
提案手法CDCRは、教育的ディスアンビギュエーション戦略と一貫性正則化を組み合わせることで、部分的マルチラベル画像分類の性能を大幅に向上させる。
Abstract
本論文は、部分的マルチラベル(PML)画像分類問題に取り組む新しい深層学習モデルを提案している。PML問題では、各画像に関連ラベルと雑音ラベルが混在する候補ラベルセットが与えられる。
提案手法CDCRは以下の2つの主要な特徴を持つ:
教育的ディスアンビギュエーション戦略:
難易度の異なるクラスを段階的に考慮しながら、候補ラベルから容易なラベルを特定していく。
これにより、深層モデルの過学習を防ぎつつ、関連ラベルを効果的に抽出できる。
一貫性正則化:
元の画像と拡張版の画像の予測結果の一貫性を正則化項として導入する。
これにより、候補ラベルに含まれる雑音ラベルの影響を抑制し、より強力な識別能力を獲得できる。
実験結果から、提案手法CDCRが従来手法を大幅に上回る性能を達成することが示された。特に、VOCデータセットでは従来最高値を5.3ポイント改善し、89.0%のmAPを達成した。また、教育的ディスアンビギュエーションと一貫性正則化の各要素が性能向上に大きく寄与することが確認された。
Stats
候補ラベルセットには平均1.6個の関連ラベルと5.3個の雑音ラベルが含まれる。
提案手法CDCRは、VOCデータセットで90.4%の完全教師あり学習と比べ、わずか2.77%の差しか出ない86.15%のmAPを達成した。
Quotes
「既存の部分的マルチラベル学習手法は、事前知識や補助情報に大きく依存しており、多くの実世界シナリオではそれらが利用できないため、望ましくない性能しか得られない。」
「深層モデルを微調整することで大幅な性能向上が可能であるが、既存の部分的マルチラベル学習手法ではそれが困難である。」