Conceptos Básicos
ビジョントランスフォーマーを特徴抽出器として用いることで、ドメイン間の差異を軽減し、転移可能で識別性の高い特徴を学習できる。
Resumen
本研究では、ビジョントランスフォーマー(ViT)を特徴抽出器として用いた敵対的ドメイン適応(VT-ADA)手法を提案している。従来のドメイン適応手法は主にConvolutional Neural Network(CNN)を特徴抽出器として用いていたが、近年注目を集めているViTがドメイン適応にも有効であることを示している。
具体的には以下の通り:
ViTはCNNと異なり、画像をパッチに分割し、それらの長距離依存性をモデル化することができる。このような特性がドメイン適応に有効である可能性がある。
VT-ADAではViTをDANNやCDANといった既存の敵対的ドメイン適応手法の特徴抽出器として用いることで、ドメイン間の差異を軽減し、識別性の高い特徴を学習できることを示している。
3つのベンチマークデータセットで実験を行い、VT-ADAがCNNベースの手法を上回る性能を発揮することを確認している。特に、より難易度の高いOffice-Homeデータセットでは大幅な性能向上が見られた。
可視化分析からも、VT-ADAが学習した特徴がドメイン間の差異を効果的に軽減していることが確認できる。
以上より、ViTはドメイン適応の文脈においても有効な特徴抽出器となり得ることが示された。
Estadísticas
ドメイン適応タスクにおいて、VT-ADAはDANNと比べて平均精度で8.8%、CDANと比べて4.9%の性能向上を達成した。
Citas
"ViTはCNNと異なり、画像をパッチに分割し、それらの長距離依存性をモデル化することができる。このような特性がドメイン適応に有効である可能性がある。"
"VT-ADAはCNNベースの手法を上回る性能を発揮し、特に難易度の高いOffice-Homeデータセットでは大幅な性能向上が見られた。"