核心概念
자율주행 시스템 개발을 위해서는 고품질 데이터셋이 필수적이다. 이 연구에서는 265개의 자율주행 데이터셋을 다양한 관점에서 심층적으로 조사하였다. 데이터셋의 영향력을 평가하는 새로운 지표를 소개하고, 주석 프로세스와 품질에 대해 분석하였다. 또한 지리적 및 악천후 환경 조건이 자율주행 시스템 성능에 미치는 영향을 면밀히 분석하였다. 마지막으로 현재 과제와 미래 자율주행 데이터셋의 발전 방향을 논의하였다.
要約
이 연구는 자율주행 분야에서 가장 포괄적인 데이터셋 조사 연구이다. 265개의 자율주행 데이터셋을 다양한 관점에서 심층적으로 분석하였다.
주요 내용은 다음과 같다:
- 데이터셋의 센서 모달리티, 데이터 크기, 작업, 환경 조건 등 기본 특성을 조사하였다.
- 데이터셋의 영향력을 평가하는 새로운 지표를 제안하였다. 이 지표는 향후 데이터셋 개발을 위한 가이드라인이 될 수 있다.
- 데이터셋의 주석 프로세스와 품질을 분석하여 표준화된 주석 파이프라인의 중요성을 강조하였다.
- 지리적 및 악천후 환경 조건이 자율주행 시스템 성능에 미치는 영향을 면밀히 분석하였다.
- 주요 데이터셋의 데이터 분포를 분석하고 장단점을 논의하였다.
- 현재 과제와 미래 자율주행 데이터셋의 발전 방향, 예를 들어 언어 통합, 비전-언어 모델 활용, 데이터 생성 표준화, 오픈 데이터 생태계 구축 등을 제시하였다.
統計
자율주행 데이터셋의 수는 2015년부터 2020년 사이에 크게 증가했으며, 이후 점차 감소하는 추세이다.
V2X 데이터셋의 경우 최근 들어 증가하는 추세를 보이고 있다.
카메라는 전체 데이터셋의 52.79%를 차지하여 가장 많이 사용되는 센서이며, LiDAR는 25.98%를 차지한다.
引用
"자율주행 시스템 개발을 위해서는 고품질 데이터셋이 필수적이다."
"데이터셋의 영향력을 평가하는 새로운 지표를 소개하고, 주석 프로세스와 품질에 대해 분석하였다."
"지리적 및 악천후 환경 조건이 자율주행 시스템 성능에 미치는 영향을 면밀히 분석하였다."