본 연구는 대형 언어 모델(LLM)을 활용하여 열린 세계 가정 환경에서의 장기 과제 계획 문제를 해결하는 새로운 상태 표현을 제안한다.
기존 방법들은 핵심 객체와 속성을 명시적으로 추적하지 못해 장기 과제에서 잘못된 결정을 내리거나, 고도로 설계된 상태 특징과 피드백에 의존하여 일반화가 어려웠다.
제안하는 방법은 LLM의 문맥 이해 및 과거 행동 추론 기능을 활용하여 객체 속성을 지속적으로 확장 및 업데이트하는 열린 상태 표현을 제공한다. 이 표현은 객체 중심의 구조화된 부분과 과거 행동 및 실패 분석에 대한 비구조화된 요약 부분으로 구성된다.
구조화된 객체 중심 부분은 각 객체의 현재 상태를 나타내는 속성 목록으로, LLM이 관찰과 추론을 통해 동적으로 확장 및 업데이트한다. 비구조화된 요약 부분은 과거 행동 내역과 실패 원인 분석을 포함하여, 객체 속성 예측 정확도를 높이고 실패 상황에 대한 대응 전략을 제공한다.
이러한 상태 표현을 통해 LLM 기반 계획 시스템은 복잡한 열린 세계 환경에서 더 정확한 상태 추적과 문맥 이해를 달성할 수 있다. 실험 결과, 제안 방법은 기존 방법 대비 장기 과제에서 크게 향상된 성능을 보였다.
To Another Language
from source content
arxiv.org
Key Insights Distilled From
by Siwei Chen,A... at arxiv.org 04-23-2024
https://arxiv.org/pdf/2311.17406.pdfDeeper Inquiries