Core Concepts
확산 모델 기반의 DUR 프레임워크를 통해 초거리 물체 이미지를 효과적으로 생성하고, 이를 활용하여 초거리 제스처 인식 모델의 성능을 크게 향상시킬 수 있다.
Abstract
본 연구에서는 초거리 물체 인식을 위한 합성 데이터 생성 프레임워크인 DUR(Diffusion in Ultra-Range)을 제안한다. DUR은 확산 모델을 기반으로 하며, 원하는 거리와 클래스(예: 제스처)를 입력받아 해당 특성을 가진 합성 이미지를 출력한다.
DUR은 기존 GAN 모델 대비 높은 품질의 합성 이미지를 생성할 수 있으며, 이를 활용하여 초거리 제스처 인식 모델인 GViT의 성능을 크게 향상시킬 수 있다. GViT 모델을 DUR이 생성한 합성 데이터로 학습시킨 결과, 실제 데이터로 학습한 모델 대비 약 37% 높은 성능을 보였다. 또한 DUR로 생성한 합성 데이터를 활용하여 실제 로봇을 제어하는 실험을 통해 DUR의 실용성을 검증하였다.
Stats
초거리에서도 제스처의 세부 특징을 구분하기 어려운 문제가 있다.
다양한 환경과 거리에서의 데이터 수집이 어려워 모델 학습에 어려움이 있다.
Quotes
"초거리 물체 인식은 로봇이 복잡한 작업을 완수하는 데 필수적이다."
"합성 데이터 생성은 실제 데이터 부족 문제를 해결할 수 있는 최근 솔루션이다."