Download Linnk AI
•
Research Assistant
>
Sign In
insight
-
ビデオ理解 大規模言語モデル
ビデオ理解を向上させるための相互作用的な視覚-テキストトークンを備えたマルチモーダルLLMの進化:MiniGPT4-Video
MiniGPT4-Videoは、ビデオの時間的な視覚的および言語的データを処理する能力を備えた、ビデオ理解のためのマルチモーダルな大規模言語モデルである。
1