ดาวน์โหลด Linnk AI
•
ผู้ช่วยวิจัย
>
ลงชื่อเข้าใช้
ข้อมูลเชิงลึก
-
마르코프 의사결정 과정에서의 효용 학습
마르코프 의사결정 과정에서 시연을 통한 효용 학습
마르코프 의사결정 과정에서 관찰된 행동으로부터 에이전트의 위험 태도를 나타내는 효용 함수를 학습하는 것이 목표이다.
1