Core Concepts
로봇이 안전한 정책을 습득하기 위해 제약 조건을 추론하는 새로운 베이지안 방법을 제안합니다.
Abstract
로봇이 안전한 정책을 습득하는 것이 중요합니다.
제약 추론 알고리즘은 데모로부터 제약 조건을 학습합니다.
제약 추론은 계산적으로 비용이 많이 들고 불안정할 수 있습니다.
제안된 베이지안 방법은 새로운 정책을 계산하지 않고 제약을 추론합니다.
제안된 방법은 다양한 심각도의 제약을 정확하게 추론합니다.
Stats
로봇이 안전한 정책을 습득하기 위한 베이지안 방법을 제안합니다.
제안된 방법은 다양한 심각도의 제약을 정확하게 추론합니다.
Quotes
"로봇이 안전한 정책을 습득하기 위해 제약 조건을 추론하는 새로운 베이지안 방법을 제안합니다." - Dimitris Papadimitriou