Ladda ner Linnk AI
•
Forskningsassistent
>
Logga in
insikt
-
長影片理解的零樣本空間-時間推理
長影片理解的零樣本空間-時間推理:利用大型語言模型的信息性推理
本文提出了一個名為VideoINSTA的框架,利用大型語言模型進行信息性的空間-時間推理,以實現長影片的零樣本理解。
1