이 논문에서는 다중 레이블 객체 탐지와 공동 발생 객체 예측을 위한 새로운 딥러닝 기반 접근 방식을 제안한다. 제안된 방법은 두 단계로 구성된다.
첫 번째 단계에서는 이미지에 존재하는 모든 경계 상자와 해당 레이블을 예측한다. 이를 위해 Faster R-CNN 및 변환기 기반 객체 탐지기를 사용한다.
두 번째 단계에서는 공동 발생 행렬 분석을 수행한다. 가장 많이 나타나는 레이블을 기본 클래스로 정의하고, 이들과 자주 함께 나타나는 클래스를 공동 발생 클래스로 식별한다. 이를 통해 기본 클래스와 해당 공동 발생 클래스 간의 관계를 파악할 수 있다.
실험은 Pascal VOC 및 MS-COCO 데이터셋에서 수행되었으며, 제안된 방법의 성능이 입증되었다. 향후에는 알려지지 않은 객체 및 부분적으로 가려진 객체에 대한 확장 연구를 계획하고 있다.
To Another Language
from source content
arxiv.org
Thông tin chi tiết chính được chắt lọc từ
by Binay Kumar ... lúc arxiv.org 03-27-2024
https://arxiv.org/pdf/2403.17223.pdfYêu cầu sâu hơn