Core Concepts
Constellation 데이터셋은 고고도 카메라로 촬영한 도시 교차로 장면에서의 보행자와 차량 탐지를 위한 벤치마크 데이터셋이다.
Abstract
Constellation 데이터셋은 뉴욕시 교차로에서 고고도 카메라로 촬영한 13,314장의 이미지로 구성되어 있다. 이 데이터셋은 다양한 시간대, 날씨 조건, 배경 변화 등의 상황에서 보행자와 차량 탐지 문제를 연구하는 데 활용할 수 있다.
실험 결과, 단일 단계 YOLO 모델이 정확도와 추론 시간 측면에서 가장 우수한 성능을 보였다. 전이 학습과 도메인 특화 데이터 증강을 통해 모델 성능을 향상시킬 수 있었다. 또한 준지도 학습 기법을 활용하여 추가적인 성능 향상을 달성했다. 그러나 보행자 탐지 정확도와 차량 탐지 정확도 사이에는 여전히 10% 정도의 격차가 존재하는 것으로 나타났다. 이는 안전 경고 생성 및 교통 분석과 같은 실제 응용 분야에 적용하기 위해서는 개선이 필요한 부분이다.
Stats
보행자 탐지 정확도(AP)가 92.0%인 모델의 추론 시간은 NVIDIA A100 GPU에서 11.5ms이다.
전체 평균 정확도(mAP)는 95.4%이다.
Quotes
"Constellation 데이터셋은 다양한 시간대, 날씨 조건, 배경 변화 등의 상황에서 보행자와 차량 탐지 문제를 연구하는 데 활용할 수 있다."
"단일 단계 YOLO 모델이 정확도와 추론 시간 측면에서 가장 우수한 성능을 보였다."
"전이 학습과 도메인 특화 데이터 증강을 통해 모델 성능을 향상시킬 수 있었다."