이 연구는 운전 데이터 합성을 위한 생성형 AI 모델을 탐구한다. 운전 시뮬레이터에서 생성된 의미론적 레이블 맵을 활용하여 사실적인 운전 이미지를 생성하는 새로운 파이프라인을 제안한다.
세 가지 생성형 AI 모델(GAN 기반 Pix2pixHD, OASIS, 확산 기반 ControlNet)을 비교 분석하였다. 이미지 품질 지표와 인지 성능 지표를 통해 평가한 결과, GAN 기반 모델들은 Cityscapes 데이터셋의 레이블 맵을 활용할 때 우수한 성능을 보였지만, CARLA 시뮬레이터의 레이블 맵을 사용할 때는 ControlNet이 더 안정적이고 구조적 충실도가 높은 결과를 생성하였다. 이는 확산 모델이 시뮬레이터 데이터의 도메인 갭 해소에 효과적일 수 있음을 시사한다.
이 연구는 운전 데이터 합성을 위한 새로운 접근법을 제시하고, 다양한 생성형 AI 모델의 성능을 비교 분석하였다. 특히 확산 모델의 잠재력을 탐구하여 시뮬레이터와 현실 간의 도메인 갭 해소에 기여할 수 있음을 보였다.
To Another Language
from source content
arxiv.org
Viktige innsikter hentet fra
by Haonan Zhao,... klokken arxiv.org 04-16-2024
https://arxiv.org/pdf/2404.09111.pdfDypere Spørsmål