Download Linnk AI
•
Forskningsassistent
>
Log på
indsigt
-
エゴセントリックアクション認識のためのクロスデータセット汎化
視覚言語モデルの汎用性を高めるための効果的なクロスモーダルアダプテーション手法
提案手法X-MICは、凍結された視覚言語モデルの表現空間に直接エゴセントリックビデオ固有の知識を注入することで、微細なクロスデータセット認識性能を大幅に向上させる。
1