본 연구에서는 초거리 물체 인식을 위한 합성 데이터 생성 프레임워크인 DUR(Diffusion in Ultra-Range)을 제안한다. DUR은 확산 모델을 기반으로 하며, 원하는 거리와 클래스(예: 제스처)를 입력받아 해당 특성을 가진 합성 이미지를 출력한다.
DUR은 기존 GAN 모델 대비 높은 품질의 합성 이미지를 생성할 수 있으며, 이를 활용하여 초거리 제스처 인식 모델인 GViT의 성능을 크게 향상시킬 수 있다. GViT 모델을 DUR이 생성한 합성 데이터로 학습시킨 결과, 실제 데이터로 학습한 모델 대비 약 37% 높은 성능을 보였다. 또한 DUR로 생성한 합성 데이터를 활용하여 실제 로봇을 제어하는 실험을 통해 DUR의 실용성을 검증하였다.
To Another Language
from source content
arxiv.org
Önemli Bilgiler Şuradan Elde Edildi
by Eran Bamani,... : arxiv.org 04-16-2024
https://arxiv.org/pdf/2404.09846.pdfDaha Derin Sorular