이 연구는 대규모 언어 모델이 교통 사고 관리를 위한 기계 학습 프로세스를 향상시키는 영향을 평가합니다. 사고 보고서를 사용하여 사고 심각도를 분류할 때 현대 언어 모델에서 생성된 특징이 예측 정확도를 향상시키거나 적어도 일치시킬 수 있는 정도를 조사합니다.
다양한 언어 모델(BERT, BERT-large, XLNet, XLNet-large, RoBERTa, RoBERTa-large, ALBERT, ALBERT-large)과 기계 학습 알고리즘(Gradient Boosted Decision Trees, Random Forests, Extreme Gradient Boosting)의 조합을 비교했습니다. 사고 보고서에서 직접 얻은 특징과 언어 모델에서 추출한 특징을 결합하면 특히 Random Forests와 Extreme Gradient Boosting 방법을 사용할 때 사고 심각도 수준 할당의 성능을 향상시키거나 적어도 일치시킬 수 있습니다.
이 연구의 주요 기여는 대규모 언어 모델을 교통 사고 관리를 위한 기계 학습 워크플로에 통합하는 방법을 보여주는 것입니다. 이를 통해 비정형 텍스트에서 특징 추출을 간소화하고 기존 기계 학습 파이프라인을 사용하여 사고 심각도 예측의 정확도를 향상시킬 수 있습니다. 이 연구는 비정형 텍스트 데이터 또는 텍스트 표현으로 변환된 특징을 기반으로 이벤트 결과를 예측하는 다른 분야에도 적용할 수 있습니다.
다른 언어로
소스 콘텐츠 기반
arxiv.org
더 깊은 질문