Linnk AIをダウンロード
•
AIリサーチアシスタント
>
サインイン
インサイト
-
ビデオ理解の統一的なアプローチ
ビデオ理解の新しい一般的なフレームワーク「OmniViD」
OmniViDは、ビデオ理解タスクを言語モデリングタスクとして扱い、時間トークンとボックストークンを導入することで、様々なビデオタスクを単一のエンコーダ・デコーダアーキテクチャで扱うことができる。
1