이 논문은 개방형 어휘 인간-객체 상호작용(HOI) 탐지 문제를 다룬다. 기존 방법들은 단일 수준의 특징 맵을 사용하여 다양한 거리의 HOI를 모델링하므로 성능이 저하되는 문제가 있었다. 또한 이들은 카테고리 이름만을 활용하여 상호작용 개념을 이해하므로 희귀하고 잘 표현되지 않는 개념을 포착하는 데 어려움이 있었다.
이 논문에서는 다음과 같은 두 가지 핵심 기여를 제안한다:
실험 결과, 제안 방법은 SWIG-HOI와 HICO-DET 데이터셋에서 최신 기술 대비 우수한 성능을 보였다.
إلى لغة أخرى
من محتوى المصدر
arxiv.org
الرؤى الأساسية المستخلصة من
by Ting Lei,Sha... في arxiv.org 04-10-2024
https://arxiv.org/pdf/2404.06194.pdfاستفسارات أعمق