이 논문은 QueryAgent라는 대화형 에이전트 기반 프레임워크를 소개한다. QueryAgent는 지식 기반 질문 답변(KBQA) 문제를 단계별로 해결하고 단계별 자기 수정을 수행한다.
주요 내용은 다음과 같다:
QueryAgent는 PyQL이라는 도구를 사용하여 단계별로 질문에 대한 실행 가능한 쿼리를 구축한다. 각 단계에서 대화형 에이전트는 현재 상황에 대한 생각을 표현하고 다음 단계의 행동을 제안한다.
QueryAgent는 ERASER라는 환경 피드백 기반 자기 수정 방법을 도입한다. ERASER는 지식베이스 실행 결과, Python 인터프리터 실행 상태, 이전 추론 기록 등의 다양한 환경 피드백을 활용하여 오류를 탐지하고 구분한다. 그리고 오류 유형에 따른 맞춤형 가이드라인을 제공하여 LLM이 오류를 수정할 수 있도록 한다.
실험 결과, QueryAgent는 기존 few-shot 방법들보다 GrailQA와 GraphQ에서 각각 7.0점, 15.0점 더 높은 성능을 보였다. 또한 실행 시간, 쿼리 횟수, API 호출 비용 등의 측면에서도 효율성이 크게 향상되었다.
추가 실험을 통해 QueryAgent와 ERASER의 범용성을 검증했다. Text2SQL 데이터셋에서도 QueryAgent가 우수한 성능을 보였고, ERASER를 다른 시스템(AgentBench)에 적용하여 성능을 크게 향상시켰다.
Sang ngôn ngữ khác
từ nội dung nguồn
arxiv.org
Thông tin chi tiết chính được chắt lọc từ
by Xiang Huang,... lúc arxiv.org 03-19-2024
https://arxiv.org/pdf/2403.11886.pdfYêu cầu sâu hơn