이 논문은 개방형 어휘 인간-객체 상호작용(HOI) 탐지 문제를 다룬다. 기존 방법들은 단일 수준의 특징 맵을 사용하여 다양한 거리의 HOI를 모델링하므로 성능이 저하되는 문제가 있었다. 또한 이들은 카테고리 이름만을 활용하여 상호작용 개념을 이해하므로 희귀하고 잘 표현되지 않는 개념을 포착하는 데 어려움이 있었다.
이 논문에서는 다음과 같은 두 가지 핵심 기여를 제안한다:
실험 결과, 제안 방법은 SWIG-HOI와 HICO-DET 데이터셋에서 최신 기술 대비 우수한 성능을 보였다.
Sang ngôn ngữ khác
từ nội dung nguồn
arxiv.org
Thông tin chi tiết chính được chắt lọc từ
by Ting Lei,Sha... lúc arxiv.org 04-10-2024
https://arxiv.org/pdf/2404.06194.pdfYêu cầu sâu hơn