메타 리플렉션이라는 새로운 오프라인 강화 학습 기술을 사용하여 언어 에이전트의 성능을 향상시키는 방법을 제시합니다. 이 기술은 과거 시도에서 얻은 경험적 학습을 기반으로 의미 메모리를 강화하여 에이전트가 시간이 지남에 따라 학습하고 성능을 향상시킬 수 있도록 합니다.