核心概念
本文提出了一種名為雙向概率校準(BiPC)的簡單有效的無監督領域自適應方法。BiPC從概率空間的角度出發,通過校準預訓練頭的概率分佈和任務頭的Gini不純度,實現了源域和目標域之間的雙向互補,從而顯著提升了模型在目標域的性能。
摘要
本文提出了一種名為雙向概率校準(BiPC)的無監督領域自適應方法。BiPC從概率空間的角度出發,包含以下兩個關鍵組件:
- 校準概率對齊(CPA):
- 利用源域標籤和目標域偽標籤,計算校準係數來調整預訓練頭的概率分佈,以減小源域和目標域之間的差距。
- 採用改進的Jensen-Shannon散度作為距離度量,並引入正則項避免出現捷徑學習。
- 校準Gini不純度(CGI):
- 利用預訓練頭的概率分佈,通過校準係數來調整任務頭的Gini不純度損失,以改善偽標籤學習。
- 當預訓練頭的概率分佈與任務頭的輸出差異較大時,引入混合概率分佈來指導偽標籤學習。
BiPC是一種簡單有效的方法,可以應用於不同的網絡架構,包括CNN和Transformer。實驗結果表明,BiPC在多個無監督領域自適應基準上取得了顯著的性能提升,甚至在部分集領域自適應任務上達到了最先進水平。
統計資料
源域和目標域之間的特徵空間差距通常較大,而概率空間差距相對較小。
校準係數 𝛼𝑠𝑡 可以有效地調整源域和目標域之間的概率分佈差異。
校準係數 𝛽𝑡 可以根據任務頭輸出與預訓練頭變換概率的差異,有效地校正Gini不純度損失。
引述
"BiPC是一種簡單有效的方法,可以應用於不同的網絡架構,包括CNN和Transformer。"
"實驗結果表明,BiPC在多個無監督領域自適應基準上取得了顯著的性能提升,甚至在部分集領域自適應任務上達到了最先進水平。"