線形マルコフ決定過程において、高確率で定数レグレットを達成する新しいアルゴリズムCert-LSVI-UCBを提案する。このアルゴリズムは、モデル誤差に頑健であり、エピソード数に依存しない定数レグレット上界を示す。