Core Concepts
대형 언어 모델을 활용하여 사지 로봇의 장기 과제 해결을 위한 고수준 추론 계층과 저수준 운동 계획 및 제어 기술을 개발하였다.
Abstract
이 연구는 사지 로봇의 장기 과제 해결을 위한 계층적 시스템을 제안한다. 고수준 추론 계층에서는 대형 언어 모델(LLM)을 활용하여 과제 분해, 매개변수 계산, 코드 생성 등의 기능을 수행한다. 저수준 계층에서는 강화학습 기반의 운동 계획 및 제어 정책을 학습하여 다양한 이동 및 조작 기술을 구현한다.
고수준 추론 계층은 세 가지 LLM 에이전트로 구성된다. 의미 플래너는 물리적 제약과 로봇 능력을 고려하여 추상적인 계획을 수립한다. 매개변수 계산기는 계획에 필요한 구체적인 매개변수를 계산한다. 코드 생성기는 계획과 매개변수를 실행 가능한 로봇 코드로 변환한다.
저수준 계층에서는 강화학습을 통해 사지 보행, 양족 보행 및 조작, 물체 밀기, 장애물 회피 등의 다양한 운동 기술을 학습한다. 이를 통해 복잡한 환경 상호작용이 가능한 유연한 행동을 구현한다.
제안 시스템은 조명 끄기, 문 열기 등의 장기 과제에서 성공적으로 작동하였다. LLM 기반 추론 계층이 전략적인 해결책을 도출하고, 저수준 운동 기술이 이를 실행하여 비트리비얼한 행동을 수행하였다.
Stats
사지 로봇이 버튼에 도달하기 위해서는 중간 단계로 박스를 밀어 올려 디딤대를 만들어야 한다.
문을 열기 위해서는 먼저 벨을 눌러 실내 사람에게 알려야 한다.
Quotes
"장기 과제를 해결하기 위해서는 물리적 실현 가능성과 기술적 한계를 동시에 고려해야 한다."
"대형 언어 모델은 복잡한 문제 해결을 위한 고수준 추론 능력을 제공한다."