線形二次レギュレータ問題において、モデルパラメータが未知の場合でも、ε-最適性を達成するためには、O(1/ε)の関数評価回数で十分であることを示した。これは、従来の研究よりも大幅に改善された結果である。