部分観測下の強化学習問題に対して、線形関数近似を用いた強化学習アルゴリズムを提案し、その標本効率を理論的に解析した。提案手法は状態空間と観測空間の大きさに依存せずに、内在次元に依存する多項式オーダーの標本複雑度を達成できることを示した。