核心概念
本文提出了一種名為OT-VP的新穎測試時自適應方法,通過最優運輸距離優化視覺提示,有效地將源域和目標域對齊,從而提高預訓練模型在未知目標域上的性能。
摘要
本文提出了一種名為Optimal Transport-guided Test-Time Visual Prompting (OT-VP)的新穎測試時自適應方法。OT-VP利用視覺提示學習來有效地適應未知的目標域,而無需修改預訓練模型的參數。
具體來說,OT-VP通過最優運輸距離來優化目標域的視覺提示,從而將目標域的表示與預先計算的源域表示對齊。這樣可以有效地彌合源域和目標域之間的分布差距,提高預訓練模型在目標域上的性能。
OT-VP的工作流程如下:
- 將未標記的目標數據通過固定的預訓練視覺編碼器和可學習的提示令牌進行處理,得到目標域的表示和伪標籤。
- 計算目標域表示與預先計算的源域表示之間的最優運輸距離,並以此距離作為優化目標,更新提示令牌。
- 使用優化後的提示令牌對目標輸入進行預測。
OT-VP在三個風格數據集(PACS、VLCS和OfficeHome)和一個受損數據集(ImageNet-C)上的實驗結果表明,它能顯著提高預訓練模型在目標域上的性能,並且在計算和內存效率方面也優於現有的最先進方法。
统计
在PACS數據集上,OT-VP相比ERM模型提高了9.0%的準確率。
在VLCS數據集上,OT-VP相比ERM模型提高了4.6%的準確率。
在OfficeHome數據集上,OT-VP相比ERM模型提高了1.4%的準確率。
在ImageNet-C數據集上,OT-VP相比ERM模型提高了11.5%的平均準確率。
引用
"OT-VP通過最優運輸距離優化視覺提示,有效地將源域和目標域對齊,從而提高預訓練模型在未知目標域上的性能。"
"OT-VP在計算和內存效率方面也優於現有的最先進方法。"