מושגי ליבה
본 논문에서는 오프라인 설정에서 LTL(Linear Temporal Logic) 지 instructions 에 따라 로봇이 복잡한 작업을 수행하도록 학습하기 위한 새로운 계층적 강화 학습 프레임워크인 DOPPLER를 제안합니다. DOPPLER는 계층적 RL과 확산 기반 옵션을 결합하여 데이터 효율성과 정책 표현력을 향상시킵니다.
תקציר
DOPPLER: 옵션을 활용한 확산 - 시간 확장 작업을 위한 계층적 생성 기술 구성
Zeyu Feng, Hao Luan, Kevin Yuchen Ma, and Harold Soh. 2024. Diffusion Meets Options: Hierarchical Generative Skill Composition for Temporally-Extended Tasks. In Proceedings of the Conference.
본 연구는 오프라인 설정에서 LTL(Linear Temporal Logic) 지 instructions 에 따라 로봇이 복잡한 작업을 수행하도록 학습하는 효과적인 방법을 개발하는 것을 목표로 합니다. 특히, 본 연구는 기존 데이터 기반 정책 학습 방법이 LTL 보상의 비마르코프적 특성과 오프라인 설정에서의 분포 이동 문제로 인해 어려움을 겪는다는 점을 해결하고자 합니다.