Decision Transformerを用いることで、オフラインでの継続的強化学習の課題を解決できる。特に、安定性と可塑性のバランスを取ることができ、学習効率の向上、分布シフトの緩和、ゼロショット汎化能力の向上が可能となる。