핵심 개념
LLM을 번역기와 검증기로 활용하여 자연어 지시를 형식적 작업 명세로 변환하고, 이를 통합 작업 및 동작 계획 알고리즘으로 해결하는 방법을 제안한다.
초록
이 논문은 자연어 지시를 효율적으로 처리하고 분석하여 통찰력 있는 정보를 제공하는 AutoTAMP 프레임워크를 제안한다.
AutoTAMP는 다음과 같은 핵심 구성요소를 가진다:
- LLM을 사용하여 자연어 지시를 형식적 작업 명세(STL)로 번역하는 기능
- 번역 과정에서 발생할 수 있는 구문적, 의미적 오류를 자동으로 검출하고 수정하는 기능
- 통합 작업 및 동작 계획 알고리즘을 활용하여 형식적 작업 명세를 최적의 로봇 궤적으로 변환하는 기능
실험 결과, AutoTAMP는 복잡한 기하학적 및 시간적 제약이 있는 작업 도메인에서 LLM을 직접 계획기로 사용하는 방법보다 우수한 성능을 보였다. 특히 구문적, 의미적 오류 수정 기능이 작업 성공률 향상에 크게 기여하였다.
추가로, AutoTAMP는 3D 시뮬레이션 및 실제 로봇 플랫폼에서 성공적으로 구현되었다.
통계
로봇의 최대 속도를 초과하지 않아야 한다.
전체 작업 시간은 주어진 시간 제한을 초과하지 않아야 한다.
인용구
"For effective human-robot interaction, robots need to understand, plan, and execute complex, long-horizon tasks described by natural language."
"Rather than using LLMs to directly plan task sub-goals, we instead perform few-shot translation from natural language task descriptions to an intermediate task representation that can then be consumed by a TAMP algorithm to jointly solve the task and motion plan."