Pobierz Linnk AI
•
Asystent Badawczy
>
Zaloguj się
spostrzeżenie
-
シミュレーション環境における動的パラメータのランダマイゼーションと適応的な行動学習
シミュレーション上での動的パラメータのエントロピー最大化によるドメインランダマイゼーション
シミュレーション上での動的パラメータのエントロピー最大化を通じて、現実世界への適応性の高い強化学習政策を自動的に獲得する。
1