BAGEL은 두 개의 노이즈 언어 모델 구성 요소(LM 레이블러와 제로 샷 LM 에이전트)를 사용하여 초기 무작위 탐험 궤적을 자연어로 잘 설명되는 궤적으로 빠르게 변환합니다. 이렇게 생성된 합성 데모를 사용하여 제로 샷 LM 에이전트의 성능을 크게 향상시킬 수 있습니다.
언어 모델 기반 에이전트가 새로운 환경에서 일반화하기 어려운 문제를 해결하기 위해, BAGEL은 언어 모델 구성요소들 간의 반복적인 상호작용을 통해 합성 데모를 생성하고 이를 활용하여 에이전트 성능을 향상시킨다.
언어 모델 기반 에이전트가 새로운 환경에서 일반화하기 위해서는 인간 데모 없이도 자동으로 합성 데모를 생성할 수 있는 방법이 필요하다. BAGEL은 두 개의 노이즈 언어 모델 구성 요소 간의 반복적인 라운드 트립을 통해 이를 달성한다.