Core Concepts
本手法は、複数のデータソースから効率的に学習し、ターゲットドメインへの適応を行う。最適輸送を用いて各ソースドメインをターゲットドメインに近づけ、その後連邦学習により最終モデルを構築する。プライバシーを保護しつつ、複数ドメインの知識を活用できる。
Abstract
本論文では、FMDA-OTと呼ばれる新しい多数ドメイン適応手法を提案している。
まず、各ソースドメインに対して最適輸送を適用し、ターゲットドメインに近い表現を得る。この際、ターゲットドメインの一部のデータ(疑似ラベル付き)を使って、新表現の有効性を評価する。
次に、連邦学習の枠組みを用いて、各ソースドメインモデルを統合する。ここで重要なのは、各ソースモデルの重みづけである。単純に各ソースのサンプル数に比例させるのではなく、ターゲットデータに対する各ソースモデルの精度に応じて重みづけを行う。
このように、最適輸送とプライバシー保護の連邦学習を組み合わせることで、複数ドメインの知識を活用しつつ、ターゲットドメインへの適応性の高いモデルを構築できる。
実験では、Office-Caltech-10とVLSCデータセットを用いて提案手法の有効性を示している。従来手法と比べて、特にVLSCデータセットで大幅な精度向上が確認できる。
Stats
各ソースドメインのサンプル数は異なる可能性がある
ターゲットドメインの一部データ(疑似ラベル付き)を利用する