본 연구는 겨울철 도로 표면 마찰력 추정을 위한 컴퓨터 비전 기반 접근법을 다룬다. 기존 연구에서는 주로 합성곱 신경망(CNN) 모델을 활용했으나, 본 연구에서는 시각 트랜스포머(ViT) 모델의 일반적인 시각 특징과 CNN의 세부 특징 추출 능력을 결합한 하이브리드 모델 WCamNet을 제안한다.
데이터 수집: 핀란드 전국 도로 인프라 네트워크의 도로변 카메라와 광학식 도로 마찰력 센서를 활용하여 대규모 데이터셋을 구축했다. 총 31개 도로변 카메라 및 기상 관측소 쌍에서 2개월간 데이터를 수집했으며, 최종적으로 48,791개 이미지와 대응되는 마찰력 값으로 구성된 데이터셋을 확보했다.
모델 구조: WCamNet은 사전 학습된 DINOv2 ViT 모델과 CNN 처리 파이프라인을 결합한 구조이다. DINOv2는 일반적인 시각 특징을 제공하고, CNN 블록은 마찰력 예측에 필요한 세부 특징을 추출한다. 이를 통해 CNN만으로는 부족한 주목 메커니즘을 보완할 수 있다.
성능 평가: WCamNet은 기존 CNN 및 ViT 모델 대비 10% 낮은 평균 절대 오차와 7% 낮은 RMSE를 달성했다. 모델 구조 분석 결과, DINOv2의 일반 시각 특징과 CNN의 세부 특징 추출이 성능 향상에 핵심적인 역할을 했음을 확인했다.
To Another Language
from source content
arxiv.org
Key Insights Distilled From
by Risto Ojala,... at arxiv.org 04-26-2024
https://arxiv.org/pdf/2404.16578.pdfDeeper Inquiries