Core Concepts
XPLは、バイアスの蓄積、ノイズ感受性、不安定性などの問題を解決するために開発された新しい手法であり、既存の方法を大幅に上回り、最先端のパフォーマンスを達成します。
Abstract
本コンテンツでは、オーディオビジュアルソースローカライゼーション(AVSL)に焦点を当てており、疑似ラベリングを用いた半教師付き学習に取り組んでいます。XPLは、クロス疑似ラベリングメカニズムと新しいソフト疑似ラベリングメカニズムを組み合わせており、2つの異なるバックボーンモデルが互いに生成した疑似ラベルを使用して訓練されます。これにより、確認バイアスが軽減されます。また、シャープニングとPL-EMA技術を組み合わせたソフト疑似ラベリングメカニズムは訓練の安定性と自己改善を大幅に向上させます。さらに、カリキュラムデータ選択機構は信頼性の高いサンプルを段階的に選択し、確認バイアス問題を軽減します。
Stats
XPLはvanilla hard pseudo-labeling (PL) を大幅に上回るパフォーマンスを示す。
XPLは他の既存手法よりも優れたローカライゼーション精度を実現する。
Quotes
"XPL significantly outperforms existing methods, achieving state-of-the-art performance while effectively mitigating confirmation bias and ensuring training stability."
"We propose a novel semi-supervised AVSL method with a cross-refine and a curriculum data selection mechanism, which trains models from different perspectives and effectively mitigates confirmation bias in pseudo-labeling of semi-supervised learning."