Завантажити Linnk AI
•
Помічник з досліджень
>
Увійти
ідея
-
마르코프 의사결정 과정에서의 효용 학습
마르코프 의사결정 과정에서 시연을 통한 효용 학습
마르코프 의사결정 과정에서 관찰된 행동으로부터 에이전트의 위험 태도를 나타내는 효용 함수를 학습하는 것이 목표이다.
1