下載 Linnk AI
•
AI 研究助理
>
登入
洞見
-
長視頻理解
視覺上下文窗口擴展:長視頻理解的新視角
通過重新定義視覺和語言上下文窗口,以及引入漸進式池化策略,我們提出了一種新的方法來處理長視頻理解任務,無需重新訓練大型多模態模型。
1