ロボットの動的操作を実現するためには、環境の未知のパラメータを効率的に同定することが重要である。本研究では、シミュレーション上で探索戦略を学習し、少量の実世界データを用いて動的システムのパラメータを同定する手法を提案する。これにより、シミュレーション上で最適な制御戦略を学習し、実世界でゼロショットで転移できる。