核心概念
VFPT,一種新穎的視覺提示微調方法,通過將快速傅立葉變換整合到提示嵌入中,有效地解決了預訓練和微調數據集之間存在顯著差異時性能下降的挑戰,從而提高了大型 Transformer 模型對新任務的適應性。
標題: 視覺傅立葉提示微調
作者: Runjia Zeng, Cheng Han, Qifan Wang, Chunshu Wu, Tong Geng, Lifu Huang, Ying Nian Wu, Dongfang Liu
會議: NeurIPS 2024
本研究旨在解決視覺提示微調中的一個關鍵挑戰:當預訓練和微調數據集之間存在顯著差異時,性能會顯著下降。