下載 Linnk AI
•
AI 研究助理
>
登入
洞見
-
컴퓨터 비전, 영상 이해
영상-언어 통합을 통한 제로샷 인간-객체 상호작용 탐지
본 연구는 영상-언어 모델의 지식을 효과적으로 통합하여 제로샷 인간-객체 상호작용 탐지 성능을 향상시키는 새로운 프레임워크를 제안한다.
1