下载 Linnk AI
•
研究助手
>
登录
洞察
-
컴퓨터 비전, 영상 이해
영상-언어 통합을 통한 제로샷 인간-객체 상호작용 탐지
본 연구는 영상-언어 모델의 지식을 효과적으로 통합하여 제로샷 인간-객체 상호작용 탐지 성능을 향상시키는 새로운 프레임워크를 제안한다.
1