Core Concepts
マスクド自己教師学習と自己学習を組み合わせることで、ビデオドメイン適応の性能を大幅に向上させることができる。
Abstract
本研究では、ビデオドメイン適応の問題に取り組んでいる。提案手法UNITEは、以下の3つのステージから構成される:
自己教師学習によるターゲットドメインの事前学習
画像教師モデルを用いてマスクされたターゲットドメインビデオの特徴表現を学習する
ソースドメインデータによる監督学習
ステージ1で学習した特徴表現をベースに、ソースドメインデータを用いて分類器を学習する
コラボレーティブ自己学習
ステージ2の分類器とCLIPの画像教師モデルを組み合わせて、ターゲットドメインの疑似ラベルを生成し、それを用いて分類器を改善する
実験の結果、提案手法UNITEは、複数のビデオドメイン適応ベンチマークにおいて、従来手法を大きく上回る性能を達成している。特に、マスクド自己教師学習とマスクド自己学習を組み合わせることで、大幅な性能向上が得られることが示された。
Stats
提案手法UNITEは、ソースドメインデータとターゲットドメインデータの両方を活用することで、ターゲットドメインの分類精度を大幅に向上させることができる。
ターゲットドメインデータのみを用いた事前学習でも、ソースドメインデータを用いた監督学習と組み合わせることで、高い性能が得られる。
Quotes
"マスクド自己教師学習と自己学習を組み合わせることで、ビデオドメイン適応の性能を大幅に向上させることができる。"
"提案手法UNITEは、複数のビデオドメイン適応ベンチマークにおいて、従来手法を大きく上回る性能を達成している。"