Core Concepts
一般化ゼロショット学習では、見られたクラスのみのサンプルを使って訓練を行うため、推論時に見られたクラスに偏る傾向がある。本研究では、マハラノビス距離を用いて投影バイアスを軽減し、見られたクラスと見られていないクラスの両方を正確に分類することを目指す。
Abstract
本研究は、一般化ゼロショット学習(GZSL)における投影バイアスの問題に取り組んでいる。GZSL は、見られたクラスのみのサンプルを使って訓練を行い、見られたクラスと見られていないクラスの両方を同時に分類することを目的とする。
主な貢献は以下の通り:
マハラノビス距離を用いて投影バイアスを軽減する手法を提案した。従来のユークリッド距離では、見られたクラスと見られていないクラスの境界が曖昧になるが、マハラノビス距離は特徴間の相関を考慮するため、より正確な分類が可能となる。
VAEGANアーキテクチャを拡張し、見られたクラスと見られていないクラスの特徴を別々に学習する2つのブランチを導入した。これにより、投影バイアスの問題に対処できる。
マハラノビス距離を最適化するための新しい損失関数を提案した。この損失関数は、同一ブランチ内の投影出力の距離を小さくし、異なるブランチ間の投影出力の距離を大きくすることを目的とする。
4つのベンチマークデータセットで実験を行った結果、提案手法が従来手法に比べて優れた性能を示すことが確認された。特に、調和平均(Harmonic Mean)指標で最大3.5%の改善が得られた。
Stats
見られたクラスと見られていないクラスの投影出力の間のマハラノビス距離を最大化し、同一ブランチ内の投影出力の距離を最小化することで、より正確な分類が可能となる。