핵심 개념
CoCoRL은 알 수 없는 보상을 가진 시연으로부터 공유 제약을 추론하는 혁신적인 방법을 제안합니다.
통계
CoCoRL은 보증된 안전 세트를 구축합니다.
CoCoRL은 최적의 안전 솔루션으로 수렴합니다.
CoCoRL은 안전한 운전 행동을 이끌어내는 제약을 학습합니다.
인용구
"CoCoRL은 보증된 안전 세트를 구축하고 추론된 CMDP를 해결하기 위해 세 가지 단계로 구성됩니다."
"이 연구는 안전성을 보장하고 새로운 작업이나 환경으로 제약을 전이하는 데 CoCoRL이 강력한 성능을 보여준다는 이론적 및 경험적 결과를 제시합니다."