Linnk AI letöltése
•
Kutatási asszisztens
>
Bejelentkezés
betekintés
-
마르코프 의사결정 과정에서의 효용 학습
마르코프 의사결정 과정에서 시연을 통한 효용 학습
마르코프 의사결정 과정에서 관찰된 행동으로부터 에이전트의 위험 태도를 나타내는 효용 함수를 학습하는 것이 목표이다.
1