핵심 개념
대형 언어 모델의 일반상식 지식을 활용하여 환경 정보와 과제 목표를 효과적으로 표현하고, 장기 과제를 세부 목표로 분해함으로써 자동화된 작업 계획기의 성능을 크게 향상시킬 수 있다.
초록
이 논문은 대형 언어 모델(LLM)과 장면 그래프를 결합하여 로봇의 장기 과제 수행을 위한 효율적인 작업 계획 기법인 DELTA를 제안한다. DELTA는 다음과 같은 핵심 단계로 구성된다:
- 도메인 생성: LLM을 활용하여 PDDL 형식의 도메인 파일을 자동으로 생성한다.
- 장면 그래프 가지치기: 과제 수행에 필요한 객체만 선별하여 장면 그래프를 간소화한다.
- 문제 생성: 가지치기된 장면 그래프와 목표 설명을 바탕으로 PDDL 형식의 문제 파일을 자동으로 생성한다.
- 목표 분해: LLM을 활용하여 장기 과제 목표를 세부 목표로 분해한다.
- 자동 순차 하위 과제 계획: 자동화된 작업 계획기를 활용하여 세부 목표들을 순차적으로 해결한다.
이를 통해 DELTA는 기존 접근법에 비해 더 높은 성공률과 계획 효율성을 달성할 수 있다. 특히 장면 그래프 가지치기와 목표 분해 단계가 핵심적인 역할을 한다.
통계
로봇 에이전트, 아이템, 방 등의 객체 유형이 정의되어 있다.
바닥 청소, 아이템 수거 및 배치 등의 행동이 정의되어 있다.
행동의 전제 조건과 효과가 명시되어 있다.
전체 과제 목표가 PDDL 형식으로 표현되어 있다.
인용구
"For mopping floor, an agent, a room and a mop are necessary, with the mop being pickable. Before the action, the agent is located in the room and has the mop in hand, the mop is clean, and the floor is not clean. After the action, the floor is clean, but the mop is not clean anymore, and the agent's battery will no longer be full."
"Decomposing a long-term task into multiple sub-tasks via classical machine learning methods can lead to a significant reduction of planning time."