오프라인 데이터셋 시퀀스를 통해 새로운 기술을 지속적으로 학습할 수 있는 에이전트의 능력이 필요하다. 그러나 제한된 리소스 환경에서 오프라인 작업 시퀀스를 연속적으로 학습하면 재앙적 망각 문제가 발생할 수 있다.


coremsg

오프라인-경험-재현을-통한-지속적인-오프라인-강화-학습


오프라인 경험 재현을 통한 지속적인 오프라인 강화 학습



오프라인 강화 학습 과제를 순차적으로 학습하면서 이전 지식을 유지하고 새로운 지식을 효과적으로 전이하는 방법을 제안한다.



지속적인 오프라인 강화 학습을 위한 확산 기반 이중 생성 재현



Decision Transformer를 활용하여 다양한 과제를 순차적으로 학습하고 이전 과제에 대한 지식을 효과적으로 유지하는 방법을 제안한다.



지속적인 오프라인 강화 학습 문제 해결을 위한 Decision Transformer 활용