본 논문은 사전 훈련 없이 새로운 객체를 즉시 감지할 수 있는 새로운 객체 감지 방법인 SDM-RAN을 제안합니다. SDM-RAN은 세 가지 주요 모듈, 즉 유사도 밀도 맵(SDM)을 사용한 위치 예측, 영역 제안 네트워크(RPN), 영역 정렬 네트워크(RAN)로 구성됩니다.
SDM은 입력 이미지에서 객체의 중심 위치를 예측하는 데 사용됩니다. 밀도 예측 모듈과 일반적인 특징 추출기로 구성된 FamNet에서 영감을 받아, SDM은 새로운 객체 데이터 세트에 대한 미세 조정 없이도 뛰어난 적응 성능을 보여줍니다. SDM은 쿼리 이미지에서 대상 객체의 가능한 위치를 나타내는 하이라이트 영역이 있는 밀도 맵을 출력합니다.
RPN은 객체의 경계 상자를 생성하는 데 사용됩니다. SDM은 객체의 위치를 제공하지만 객체의 영역에 대한 정보는 제공하지 않습니다. 따라서 Faster-RCNN에서 제안된 RPN을 사용하여 객체의 잠재적인 경계 상자를 생성합니다.
RAN은 SDM과 RPN에서 생성된 객체 후보 영역을 정렬하고 검증하는 데 사용됩니다. RAN은 Deep Siamese Network(DSN) 구조를 기반으로 하며, 입력으로 지원 이미지와 쿼리 이미지를 받습니다. RAN은 두 이미지에서 추출된 특징을 비교하여 객체의 중심 위치, 너비 및 높이를 조정하여 객체의 정확한 영역을 예측합니다.
제안된 SDM-RAN은 MS COCO 및 PASCAL VOC 데이터 세트에서 광범위하게 평가되었으며, 미세 조정 없이도 최첨단 성능을 달성했습니다. 특히, SDM-RAN은 낮은 샷 설정(예: 1-샷, 3-샷)에서 인상적인 결과를 보여주었으며, 이는 새로운 객체를 감지하는 데 있어서 SDM과 RAN의 효과를 입증합니다. 또한 SDM-RAN은 기존의 FSOD-AO 방법에 비해 빠른 실행 속도를 제공합니다.
본 논문에서 제안된 SDM-RAN은 미세 조정 없이 새로운 객체를 즉시 감지할 수 있는 새로운 객체 감지 방법입니다. SDM-RAN은 객체 위치 및 영역 제안을 동시에 평가하여 기존 방법보다 뛰어난 성능을 달성합니다. 실험 결과는 SDM-RAN이 다양한 객체 감지 작업, 특히 새로운 객체를 빠르게 감지해야 하는 작업에 효과적임을 보여줍니다.
In un'altra lingua
dal contenuto originale
arxiv.org
Approfondimenti chiave tratti da
by Junyu Hao, J... alle arxiv.org 11-05-2024
https://arxiv.org/pdf/2411.02181.pdfDomande più approfondite