Core Concepts
비전 트랜스포머 기술을 활용하여 교통 표지판 인식 성능을 크게 향상시킬 수 있다.
Abstract
이 연구는 비전 트랜스포머 기술을 활용한 혁신적인 교통 표지판 인식 방법을 소개한다. 기존의 수동 특징 추출 기반 접근법은 많은 노력과 비용이 소요되었으며, 조명 변화, 가림 현상, 크기 변화 등에 취약했다. 이 연구에서는 PVT, TNT, LNL 등 3가지 유형의 비전 트랜스포머 모델과 6가지 합성곱 신경망 모델을 기준 모델로 사용하였다.
또한 진화 알고리즘(EA)과 트랜스포머 아키텍처를 결합한 새로운 피라미드 EATFormer 백본을 제안하였다. EAT 블록은 Feed-Forward Network, Global and Local Interaction, Multi-Scale Region Aggregation 모듈로 구성되어 있으며, 상호작용, 개별, 다중 스케일 정보를 효과적으로 캡처한다. 추가로 Modulated Deformable MSA 모듈을 도입하여 불규칙적인 위치를 동적으로 모델링할 수 있도록 하였다.
GTSRB와 BelgiumTS 데이터셋에 대한 실험 결과, 제안 모델이 예측 속도와 정확도 면에서 기존 기술을 크게 능가하는 것으로 나타났다. 이는 비전 트랜스포머가 교통 표지판 분류에 큰 잠재력을 가지고 있음을 보여준다. 이 연구 결과는 정확하고 신뢰할 수 있는 교통 표지판 인식 알고리즘 개발에 기여할 것으로 기대된다.
Stats
제안 모델은 GTSRB 데이터셋에서 98.41%의 정확도, 98.51%의 정밀도, 98.41%의 재현율, 98.42%의 F1-score를 달성했다.
제안 모델은 BelgiumTS 데이터셋에서 92.16%의 정확도, 94.83%의 정밀도, 92.17%의 재현율, 92.54%의 F1-score를 달성했다.
제안 모델은 기존 모델 대비 파라미터 수와 추론 시간이 크게 감소했다.
Quotes
"비전 트랜스포머는 교통 표지판 분류에 큰 잠재력을 가지고 있으며, 이 연구는 TSR을 위한 새로운 알고리즘 프레임워크를 제공한다."
"제안 모델은 예측 속도와 정확도 면에서 기존 기술을 크게 능가하여, 실시간 교통 안전 및 운전자 지원 시스템에 적합하다."