核心概念
우주선 임무를 안전하게 수행하기 위해 보호된 심층 강화 학습이 중요하다.
统计
SDRL은 정책 성능을 향상시키고 우주선 작업에 필요한 훈련 시간을 줄임
보호된 심층 강화 학습은 안전한 행동을 보장하고 잘못된 행동을 교정함
보호된 심층 강화 학습은 안전성을 보장하며 우주선 운영에 필요한 훈련 시간을 줄임
引用
"우주선 임무를 안전하게 수행하기 위해 보호된 심층 강화 학습이 중요하다."
"우주선 임무 및 안전 요구 사항을 형식화하기 위해 선형 시간 논리 (LTL)를 활용한다."
"보호된 심층 강화 학습은 우주선 운영에 필요한 훈련 시간을 줄이고 정책 성능을 향상시킨다."