본 연구는 자율주행 차량을 위한 안전한 선호도 학습 방법을 제안한다. 기존 선호도 학습 방법은 안전성을 고려하지 않아 위험한 행동을 선호할 수 있지만, 제안하는 방법은 신호 시간 논리(STL)를 활용하여 안전 규칙을 준수하면서도 사용자 선호도를 반영할 수 있다.
구체적으로, 제안하는 방법은 가중치 신호 시간 논리(WSTL)를 사용하여 사용자 선호도와 안전 규칙을 동시에 표현한다. 그리고 이를 최적화 문제로 정식화하여 해결함으로써, 선호도와 안전성을 모두 만족하는 가중치를 찾는다.
실험 결과, 제안하는 방법은 기존 방법에 비해 안전성 측면에서 크게 향상된 성능을 보였다. 특히 안전 규칙을 위반하는 행동을 선호하는 경우에도 제안하는 방법은 안전한 행동을 선택하였다. 또한 제안하는 방법의 결과는 추후 정확-맞춤 제어기 합성에 활용할 수 있다는 장점이 있다.
Ke Bahasa Lain
dari konten sumber
arxiv.org
Wawasan Utama Disaring Dari
by Ruya Karagul... pada arxiv.org 03-13-2024
https://arxiv.org/pdf/2311.02099.pdfPertanyaan yang Lebih Dalam