Lumos는 복잡한 대화형 과제를 해결하기 위한 통합되고 모듈화된 오픈소스 에이전트 학습 프레임워크이다. 이 프레임워크는 계획 모듈, 접지 모듈 및 실행 모듈로 구성되어 있다.
계획 모듈은 복잡한 과제를 일련의 고수준 하위 목표로 분해한다. 접지 모듈은 계획 모듈에서 생성된 하위 목표를 실행 가능한 작업으로 변환한다. 실행 모듈은 다양한 도구를 사용하여 이러한 작업을 수행한다.
Lumos는 두 가지 에이전트 학습 및 추론 방식을 제안한다. Lumos-OnePass(Lumos-O)는 모든 하위 목표와 작업을 한 번에 생성하는 효율적인 방식이다. Lumos-Iterative(Lumos-I)는 이전 실행 결과를 기반으로 하위 목표를 순차적으로 생성하는 적응형 방식이다.
Lumos는 다양한 대화형 과제 유형(QA, 수학, 웹 탐색, 멀티모달 등)에 걸쳐 통합된 데이터 형식을 사용한다. 이를 위해 기존 벤치마크의 지식 근거를 활용하여 고품질 주석을 생성했다. 이 주석은 약 56,000개의 다중 작업 다중 도메인 에이전트 학습 주석으로 구성된다.
Lumos는 다양한 오픈소스 에이전트와 GPT 기반 에이전트를 능가하는 성능을 보여준다. 또한 새로운 과제와 환경에서도 우수한 일반화 능력을 입증했다.
Na inny język
z treści źródłowej
arxiv.org
Głębsze pytania