本稿では、Transformer動態モデル(TDM)の高速な推論を実現するために、短期計画とQ-Transformerによる長期的な価値推定を組み合わせた、モデルベースの強化学習アルゴリズムであるQT-TDMを提案する。