Keskeiset käsitteet
본 논문은 강화학습을 이용한 자율주행 차량의 궤적 계획 방법을 제안한다. 제안된 방법은 학습 과정의 안정성을 높이는 반복적 보상 예측 기법과 불확실성을 고려하는 기법을 포함한다.
Tiivistelmä
본 논문은 자율주행 차량의 궤적 계획을 위한 강화학습 기반 방법을 제안한다. 기존의 전통적인 궤적 계획 방법들은 일반성 부족과 복잡한 운동 생성의 한계가 있다. 이를 해결하기 위해 강화학습을 활용한 궤적 계획 방법이 제안되었지만, 학습의 불안정성과 불확실성 고려 부족의 문제가 있었다.
제안된 방법은 다음과 같은 핵심 기술을 포함한다:
학습 과정의 안정성을 높이는 반복적 보상 예측 기법
불확실성을 고려하는 기법
반복적 보상 예측 기법은 에이전트의 미래 행동을 고려하여 보상을 더 정확하게 예측함으로써 학습 안정성을 높인다. 불확실성 고려 기법은 감지, 예측, 제어 등의 불확실성을 고려하여 안전한 주행을 가능하게 한다.
제안된 방법은 CARLA 시뮬레이터에서 실험되었으며, 기존 방법 대비 충돌률을 60.17% 감소시키고 평균 보상을 30.82배 향상시켰다.
Tilastot
제안된 방법은 기존 방법 대비 충돌률을 60.17% 감소시켰다.
제안된 방법은 기존 방법 대비 평균 보상을 30.82배 향상시켰다.
Lainaukset
"전통적인 궤적 계획 방법들은 일반성 부족과 복잡한 운동 생성의 한계가 있다."
"강화학습을 활용한 궤적 계획 방법이 제안되었지만, 학습의 불안정성과 불확실성 고려 부족의 문제가 있었다."