本論文では、ビジョン-言語モデルのテスト時ゼロショット一般化を向上させるための新しいアプローチを提案している。従来のプロンプト学習に頼るのではなく、ロバストなMeanShiftアルゴリズムを拡張した手法「MTA」を導入する。
MTAは以下の特徴を持つ:
広範な実験の結果、MTAはプロンプト学習手法を上回る性能を示し、スタンドアロンおよびAPI連携アプリケーションの両方に適した解決策であることが分かった。さらに、MTAは既存の少量学習手法とも相性が良く、一貫して性能向上をもたらすことが確認された。
To Another Language
from source content
arxiv.org
Key Insights Distilled From
by Maxime Zanel... at arxiv.org 05-06-2024
https://arxiv.org/pdf/2405.02266.pdfDeeper Inquiries