Core Concepts
提案手法の双メモリネットワークは、訓練データと過去のテストデータの知識を活用することで、ゼロショット、フューショット、トレーニングフリーフューショットの3つの適応タスクに対して優れた性能を発揮する。
Abstract
本論文は、事前学習された視覚言語モデルを様々な下流タスクに適応させる汎用的な手法を提案している。
具体的には、動的メモリネットワークと静的メモリネットワークから成る双メモリネットワーク(DMN)を提案している。
動的メモリネットワークは、テスト時に蓄積されたテストサンプルの特徴量を保持し、それを活用することで、ゼロショットおよびフューショットの性能を向上させる。
一方、静的メモリネットワークは、訓練データの特徴量を保持し、トレーニングフリーのフューショット適応を可能にする。
これらの2つのメモリネットワークは同一の柔軟なメモリ相互作用戦略を用いており、トレーニングフリーモードでも動作し、さらに学習可能な射影層を組み込むことで、従来のフューショット設定でも性能を向上できる。
提案手法は11のデータセットで評価され、ゼロショットでは既存手法を3%以上上回り、外部トレーニングデータを利用する手法をも凌駕する。
さらに、自然な分布シフトに対しても頑健な性能を示す。
Stats
ゼロショットでの提案手法の精度は既存手法を3%以上上回る
外部トレーニングデータを利用する手法をも凌駕する
Quotes
提案手法は、ゼロショット、フューショット、トレーニングフリーフューショットの3つの適応タスクに対して有効に機能する