오프라인 데이터셋 시퀀스를 통해 새로운 기술을 지속적으로 학습할 수 있는 에이전트의 능력이 필요하다. 그러나 제한된 리소스 환경에서 오프라인 작업 시퀀스를 연속적으로 학습하면 재앙적 망각 문제가 발생할 수 있다.
오프라인 강화 학습 과제를 순차적으로 학습하면서 이전 지식을 유지하고 새로운 지식을 효과적으로 전이하는 방법을 제안한다.
Decision Transformer를 활용하여 다양한 과제를 순차적으로 학습하고 이전 과제에 대한 지식을 효과적으로 유지하는 방법을 제안한다.