Download Linnk AI
•
Research Assistant
>
Sign In
insight
-
멀티모달 LLM을 이용한 비디오 이해
비디오 이해를 위한 시각-언어 토큰 상호 배치를 통한 멀티모달 LLM의 발전: MiniGPT4-Video
MiniGPT4-Video는 비디오의 시각적 및 텍스트적 데이터를 종합적으로 처리하여 비디오 이해 능력을 향상시킨 멀티모달 LLM 모델이다.
1