Download Linnk AI
•
Autonomous Research Assistant
>
Sign In
insight
-
強化学習 コスト制約
コスト制約下での強化学習における専門家の行動の模倣
専門家の行動を観察することで、報酬モデルだけでなくコスト制約モデルも学習し、コスト制約を満たしつつ専門家の行動を模倣する手法を提案する。
1