본 연구에서는 초거리 물체 인식을 위한 합성 데이터 생성 프레임워크인 DUR(Diffusion in Ultra-Range)을 제안한다. DUR은 확산 모델을 기반으로 하며, 원하는 거리와 클래스(예: 제스처)를 입력받아 해당 특성을 가진 합성 이미지를 출력한다.
DUR은 기존 GAN 모델 대비 높은 품질의 합성 이미지를 생성할 수 있으며, 이를 활용하여 초거리 제스처 인식 모델인 GViT의 성능을 크게 향상시킬 수 있다. GViT 모델을 DUR이 생성한 합성 데이터로 학습시킨 결과, 실제 데이터로 학습한 모델 대비 약 37% 높은 성능을 보였다. 또한 DUR로 생성한 합성 데이터를 활용하여 실제 로봇을 제어하는 실험을 통해 DUR의 실용성을 검증하였다.
To Another Language
from source content
arxiv.org
Djupare frågor