이 연구는 합성 데이터의 동등성, 대체 가능성 및 유연성을 실증적으로 탐구한다.
먼저, MOT17 데이터셋에서 실제 데이터와 합성 데이터의 대체 가능성을 확인한다. 실험 결과, 합성 데이터로 실제 데이터의 60-80%를 대체할 수 있었다. 이는 데이터 수집 및 주석 비용을 크게 줄일 수 있음을 시사한다.
다음으로, DanceTrack 데이터셋에서 합성 데이터 분포가 모델 성능에 미치는 영향을 분석한다. 다양한 유형의 합성 데이터셋을 활용한 실험 결과, 타깃 데이터셋과 유사한 복잡도와 분포를 가진 합성 데이터가 모델 성능 향상에 효과적이었다. 이는 유연한 합성 데이터 생성기를 통해 타깃 도메인과의 격차를 줄이는 것이 중요함을 보여준다.
종합적으로, 이 연구는 합성 데이터의 실용적인 활용 방안을 제시하고, 합성 데이터 생성 및 활용에 대한 실용적인 통찰을 제공한다.
Іншою мовою
із вихідного контенту
arxiv.org
Ключові висновки, отримані з
by Che-Jui Chan... о arxiv.org 03-26-2024
https://arxiv.org/pdf/2403.16244.pdfГлибші Запити