언어 모델 기반 에이전트가 새로운 환경에서 일반화하기 위해서는 인간 데모 없이도 자동으로 합성 데모를 생성할 수 있는 방법이 필요하다. BAGEL은 두 개의 노이즈 언어 모델 구성 요소 간의 반복적인 라운드 트립을 통해 이를 달성한다.
BAGEL은 두 개의 노이즈 언어 모델 구성 요소(LM 레이블러와 제로 샷 LM 에이전트)를 사용하여 초기 무작위 탐험 궤적을 자연어로 잘 설명되는 궤적으로 빠르게 변환합니다. 이렇게 생성된 합성 데모를 사용하여 제로 샷 LM 에이전트의 성능을 크게 향상시킬 수 있습니다.