Core Concepts
대규모 언어 모델을 활용하여 교통 사고 보고서의 비정형 텍스트 데이터에서 특징을 추출하고, 이를 전통적인 기계 학습 기법과 결합하여 교통 사고 심각도 분류 성능을 향상시킬 수 있다.
Abstract
이 연구는 대규모 언어 모델이 교통 사고 관리를 위한 기계 학습 프로세스를 향상시키는 영향을 평가합니다. 사고 보고서를 사용하여 사고 심각도를 분류할 때 현대 언어 모델에서 생성된 특징이 예측 정확도를 향상시키거나 적어도 일치시킬 수 있는 정도를 조사합니다.
다양한 언어 모델(BERT, BERT-large, XLNet, XLNet-large, RoBERTa, RoBERTa-large, ALBERT, ALBERT-large)과 기계 학습 알고리즘(Gradient Boosted Decision Trees, Random Forests, Extreme Gradient Boosting)의 조합을 비교했습니다. 사고 보고서에서 직접 얻은 특징과 언어 모델에서 추출한 특징을 결합하면 특히 Random Forests와 Extreme Gradient Boosting 방법을 사용할 때 사고 심각도 수준 할당의 성능을 향상시키거나 적어도 일치시킬 수 있습니다.
이 연구의 주요 기여는 대규모 언어 모델을 교통 사고 관리를 위한 기계 학습 워크플로에 통합하는 방법을 보여주는 것입니다. 이를 통해 비정형 텍스트에서 특징 추출을 간소화하고 기존 기계 학습 파이프라인을 사용하여 사고 심각도 예측의 정확도를 향상시킬 수 있습니다. 이 연구는 비정형 텍스트 데이터 또는 텍스트 표현으로 변환된 특징을 기반으로 이벤트 결과를 예측하는 다른 분야에도 적용할 수 있습니다.
Stats
2013년 미국에서만 500만 건 이상의 교통 사고가 보고되었습니다.
교통 사고 심각도 분류는 대응에 필요한 자원(팀 규모, 장비, 교통 통제 조치)을 결정하는 데 필수적입니다.
교통 사고의 확률적 특성으로 인해 사고 심각도 분류에 어려움이 있습니다.
Quotes
"대규모 언어 모델(LLM)은 사고 보고서의 비정형 텍스트 데이터를 이해하고 처리할 수 있는 능력을 보여줌으로써 기존 기계 학습 접근 방식을 보완할 수 있는 중요한 기회를 제공합니다."
"언어 모델 기능과 전통적인 사고 보고서 기능을 결합하면 특히 Random Forests와 Extreme Gradient Boosting 방법을 사용할 때 사고 심각도 수준 할당의 성능을 향상시키거나 적어도 일치시킬 수 있습니다."