Download Linnk AI
•
Forskningsassistent
>
Log på
indsigt
-
シミュレーション環境における動的パラメータのランダマイゼーションと適応的な行動学習
シミュレーション上での動的パラメータのエントロピー最大化によるドメインランダマイゼーション
シミュレーション上での動的パラメータのエントロピー最大化を通じて、現実世界への適応性の高い強化学習政策を自動的に獲得する。
1