도메인 일반 자동 평가 모델을 사용하여 웹 내비게이션 및 기기 제어 에이전트의 성능을 크게 향상시킬 수 있다.
웹 사이트 구조의 높은 변동성으로 인해 기존 접근법이 실패하는 문제를 해결하기 위해, 차별화된 순위 모델과 새로운 지침 합성 기술을 사용하여 대규모 언어 모델의 프롬프트를 최적으로 채우는 WILBUR 접근법을 소개한다.