객체 탐지 모델의 성능 향상을 위해 평균 정밀도(mAP)를 직접 최적화하는 강화 학습 기반 능동 학습 기법을 제안한다.
객체 탐지를 노이즈 제거 확산 프로세스로 정의하고, 일관성 모델의 자기 일관성 특성을 활용하여 효율적인 객체 탐지 프레임워크를 제안한다.
안정 확산 모델을 기반으로 한 InstaGen은 사진 실사적인 이미지와 객체 경계 상자를 대규모로 생성할 수 있으며, 이를 활용하여 객체 탐지기의 성능을 크게 향상시킬 수 있다.
객체 탐지기의 분류 및 회귀 과제를 모두 고려하여 학생 모델의 실제 학습 상태를 정확하게 반영하는 지식 증류 방법을 제안한다.
기존 모델들은 새로운 클래스를 잘못 분류하는 문제가 있다. 본 연구에서는 새로운 클래스만 테스트 단계에서 등장하는 새로운 벤치마크를 제안하고, YOLO 기반의 YOLOOC 모델을 제안한다. 라벨 스무딩을 통해 모델이 기존 클래스 특징에 과적합되는 것을 방지하고 새로운 클래스를 발견할 수 있도록 한다.
본 논문은 기존 객체 탐지 신경망 모델을 수정하지 않고도 실시간으로 OoD(Out-of-Distribution) 객체를 탐지할 수 있는 Box Abstraction Monitors(BAM) 기법을 제안한다. BAM은 ID(In-Distribution) 데이터의 특징을 유한개의 볼록 다면체로 표현하여 OoD 데이터를 효과적으로 탐지할 수 있다.
T-Rex2는 텍스트 프롬프트와 시각 프롬프트를 통합하여 다양한 시나리오에서 강력한 제로샷 객체 탐지 기능을 제공합니다.
특징 맵 드롭아웃에 대한 경계 상자의 안정성 정도가 다양한 환경에서의 객체 탐지기 성능을 잘 반영한다.
본 논문은 교차 도메인 소량 샷 객체 탐지(CD-FSOD) 문제를 해결하기 위해 기존 오픈셋 객체 탐지기를 개선하는 방법을 제안한다. 제안 방법인 CD-ViTO는 학습 가능한 인스턴스 특징, 인스턴스 재가중, 도메인 프롬프터 등의 모듈을 통해 도메인 간 격차 문제를 해결하여 기존 오픈셋 탐지기 대비 큰 성능 향상을 달성한다.
이벤트 카메라와 RGB 카메라를 융합하여 모든 조명 조건에서 강력하고 효율적인 객체 탐지를 달성하는 새로운 프레임워크 EOLO를 제안한다.