Core Concepts
자율주행 차량이 역동적인 환경에서 경쟁적인 전략을 생성하고 연속적인 운동 계획을 동시에 수행할 수 있는 방법을 제안한다.
Abstract
이 논문은 자율주행 차량이 역동적이고 적대적인 다중 에이전트 환경에서 경쟁적인 전략을 생성하고 연속적인 운동 계획을 수행하는 문제를 다룬다. 기존 접근법은 에이전트 행동을 이산화하거나 해석할 수 없는 잠재 공간에서 계획하여 성능 저하 또는 이해하기 어려운 에이전트 행동을 초래한다.
이 논문에서는 정책 특성 공간(Policy Characteristic Space)을 통해 에이전트 정책을 사전 지정된 저차원 공간에 매핑하는 에이전트 전략 표현 방법을 제안한다. 정책 특성 공간을 통해 에이전트 정책 전환을 이산화하면서도 제어의 연속성을 유지할 수 있다. 또한 에이전트 정책과 정책 전환의 의도를 명확히 제공할 수 있다. 그 다음 후회 최소화 게임 이론 접근법을 정책 특성 공간에 적용하여 적대적 환경에서 높은 성능을 달성할 수 있다.
제안된 방법은 축소 차량을 이용한 자율 레이싱 시나리오에서 평가되었다. 통계적 증거를 통해 제안된 방법이 에이전트의 승률을 크게 향상시키고 알 수 없는 환경에도 잘 일반화된다는 것을 보여준다.
Stats
제안된 방법은 에이전트의 승률을 크게 향상시킨다.
제안된 방법은 알 수 없는 환경에서도 잘 일반화된다.
Quotes
"자율주행 차량이 역동적이고 적대적인 다중 에이전트 환경에서 경쟁적인 전략을 생성하고 연속적인 운동 계획을 수행하는 문제를 다룬다."
"정책 특성 공간을 통해 에이전트 정책 전환을 이산화하면서도 제어의 연속성을 유지할 수 있다."
"후회 최소화 게임 이론 접근법을 정책 특성 공간에 적용하여 적대적 환경에서 높은 성능을 달성할 수 있다."