行動クローニング(BC)と強化学習(RL)を組み合わせた新しい手法であるResiPは、BCで学習した軌道計画器にRLで学習した残差制御器を組み合わせることで、高精度なロボットマニピュレーションタスクを効率的に学習できる。