Core Concepts
모델 기반 강화 학습에서 전략적 꿈을 활용하여 일반적 에이전트의 성능 향상
Stats
"Dr. Strategy는 9-room 및 spiral 9-room에서 거의 100%의 성공률을 보임."
"Maze-7x7 환경에서 Dr. Strategy는 80% 이상의 성공률을 달성."
"RoboKitchen에서 Dr. Strategy는 LEXA 및 LEXA-Explore와 비교 가능한 성과를 보임."
Quotes
"우리는 목표를 달성하기 위해 고정된 랜드마크에서 학습하는 것이 성능을 향상시키는 것으로 판명되었습니다."
"Strategic Dreaming은 복잡한 공간 탐색 및 의사 결정에 혁명을 일으킬 수 있습니다."