本論文では、テスト時の分布シフトに対応するための新しい手法「Forward-Only Adaptation (FOA)」を提案している。
FOAの特徴は以下の通り:
モデルの重みを変更せずに、入力プロンプトの最適化と活性化の調整を行うことで、効率的な適応を実現する。これにより、リソース制限の厳しい端末でも適用可能となる。
プロンプトの最適化にはCMAエボリューション戦略を用いる。従来のCMAでは高次元最適化が困難であり、教師信号を必要としていたが、本手法ではモデルの予測エントロピーと活性化の分布ギャップを組み合わせた新しい評価関数を提案することで、これらの課題を解決している。
さらに、テスト時の活性化をソースドメインに近づける「back-to-source activation shifting」を導入することで、適応性能をさらに向上させている。
4つのベンチマークデータセットと、量子化モデルを含む様々な設定で評価を行い、従来手法を上回る性能を示している。特に、8ビット量子化モデルでは、32ビットの完全精度モデルを使うTENTよりも優れた性能を達成している。
A otro idioma
del contenido fuente
arxiv.org
Ideas clave extraídas de
by Shuaicheng N... a las arxiv.org 04-03-2024
https://arxiv.org/pdf/2404.01650.pdfConsultas más profundas