Tải xuống Linnk AI
•
Trợ lý nghiên cứu
>
Đăng nhập
thông tin chi tiết
-
제로샷 비디오 질문 답변
비디오 대신 이미지 그리드로도 효과적인 비디오 질문 답변이 가능하다
단일 비전 언어 모델(VLM)을 활용하여 비디오를 이미지 그리드로 변환하면 비디오 이해 및 질문 답변이 가능하다.
1