Concepts de base
ゼロショット分類モデルは、大規模なウェブデータを用いた事前学習の影響を受けるため、ラベル分布のミスマッチにより性能が低下する。本手法は、ラベル分布の推定値を用いたオプティマル・トランスポートによって、ラベル分布のミスマッチを補正し、ゼロショット分類の精度を向上させる。
Résumé
本論文では、ゼロショット分類モデルの性能低下の主な原因として、事前学習データのラベル分布とターゲットタスクのラベル分布のミスマッチを指摘している。既存の手法では、ラベル分布の情報が必要であったり、追加の学習が必要であったりするが、本手法では、ターゲットタスクのラベル分布の推定値のみを用いて、オプティマル・トランスポートによってラベル分布のミスマッチを補正することができる。
理論的には、ラベル分布のミスマッチがない場合、オプティマル・トランスポートを用いることで、ベイズ最適分類器を復元できることを示している。また、ラベル分布の推定誤差やモデルの校正誤差に対する頑健性についても分析している。
実験では、画像分類タスクと文章分類タスクにおいて、ゼロショット分類の精度が平均4.8%および15.5%向上することを示している。さらに、少量の教師データを用いた場合でも、ラベル分布の推定とオプティマル・トランスポートの組み合わせにより、精度が向上することを確認している。
Stats
ゼロショット分類の精度は、ラベル分布のミスマッチにより大きく低下する
提案手法OTTER(Optimal TransporT adaptER)は、ターゲットタスクのラベル分布の推定値を用いてオプティマル・トランスポートを行うことで、ラベル分布のミスマッチを補正できる
OTTERは、ラベル分布のミスマッチがない場合、ベイズ最適分類器を復元できる
OTTERは、ラベル分布の推定誤差やモデルの校正誤差に対して頑健である
Citations
"Popular zero-shot models suffer due to artifacts inherited from pretraining. A particularly detrimental artifact, caused by unbalanced web-scale pretraining data, is mismatched label distribution."
"Existing approaches that seek to repair the label distribution are not suitable in zero-shot settings, as they have incompatible requirements such as access to labeled downstream task data or knowledge of the true label balance in the pretraining distribution."
"Theoretically, we show that optimal transport given the true label distribution of the downstream can recover the Bayes-optimal classifier under mild conditions."