Core Concepts
LLM 에이전트의 오픈월드 문제 해결을 위해 탐색과 활용 과정을 분리하고, 약한 탐색 에이전트와 강한 활용 에이전트를 활용하여 효과적이고 효율적인 문제 해결을 달성한다.
Abstract
이 논문은 LLM(Large Language Model) 에이전트의 오픈월드 문제 해결 능력을 향상시키기 위한 새로운 접근법인 WESE(Weak Exploration to Strong Exploitation)를 제안한다.
기존 연구들은 주로 프롬프트 엔지니어링이나 태스크 특화 파인튜닝을 통해 에이전트의 추론 및 의사결정 능력을 향상시키는데 초점을 맞추었다. 그러나 이러한 방법들은 오픈월드 환경에서의 탐색과 활용 과정을 간과하여 한계를 보였다.
WESE는 탐색과 활용 과정을 분리하여 수행한다. 먼저 약한 LLM 에이전트가 환경을 탐색하여 관련 지식을 획득하고, 이를 지식 그래프 형태로 압축한다. 이후 강한 LLM 에이전트가 이 지식 그래프를 활용하여 문제를 해결한다. 이를 통해 효과적이고 효율적인 문제 해결이 가능하며, 비용 측면에서도 이점을 얻을 수 있다.
구체적으로 WESE는 다음과 같은 과정으로 구성된다:
약한 LLM 에이전트가 환경을 탐색하여 관련 지식을 획득하고 지식 그래프로 구축한다.
강한 LLM 에이전트가 지식 그래프에서 관련 정보를 추출하여 문제를 해결한다.
약한 탐색 에이전트와 강한 활용 에이전트의 조합을 통해 효과성, 효율성, 비용 측면에서 우수한 성능을 달성한다.
WESE는 다양한 오픈월드 대화형 벤치마크에서 기존 방법들 대비 우수한 성능을 보였다. 특히 성공률, 소요 단계 수, 비용 측면에서 균형 잡힌 성과를 달성하였다.
Stats
오픈월드 과제에서 기존 방법들은 전역적인 환경 정보 부족으로 인해 최적이 아닌 의사결정을 내리게 된다.
환경 탐색을 통해 획득한 정보에는 관련 없는 내용이 많아 오히려 에이전트의 의사결정에 부정적인 영향을 미친다.
WESE는 약한 에이전트를 활용한 탐색과 강한 에이전트를 활용한 활용 과정의 분리를 통해 이러한 문제를 해결할 수 있다.
Quotes
"기존 연구들은 주로 프롬프트 엔지니어링이나 태스크 특화 파인튜닝을 통해 에이전트의 추론 및 의사결정 능력을 향상시키는데 초점을 맞추었다."
"WESE는 탐색과 활용 과정을 분리하여 수행한다. 먼저 약한 LLM 에이전트가 환경을 탐색하여 관련 지식을 획득하고, 이를 지식 그래프 형태로 압축한다. 이후 강한 LLM 에이전트가 이 지식 그래프를 활용하여 문제를 해결한다."