Core Concepts
대형 언어 모델을 활용하여 동적 환경에서 인간의 행동을 예측하고, 이를 고려한 로봇 작업 계획을 수립하는 방법을 제안한다.
Abstract
이 논문은 대형 언어 모델(LLM)을 활용하여 인간 인식 기반 로봇 작업 계획 방법을 제안한다.
먼저, 3D 장면 그래프를 활용하여 환경을 표현하고, 인간을 장면 그래프의 노드로 모델링한다. 이를 통해 인간과 주변 객체 간의 의미론적 관계를 효과적으로 나타낼 수 있다.
다음으로, LLM을 활용하여 과거 관측 데이터를 기반으로 미래 인간 행동을 예측한다. 예측된 인간 행동을 목표 상태로 설정하고, 로봇과 인간을 함께 고려하는 다중 에이전트 작업 계획 문제로 변환한다.
이를 통해 로봇이 인간의 행동을 고려하여 작업을 수행할 수 있도록 한다. 또한 LLM의 지식을 활용하여 작업 계획 문제를 형식 언어로 표현하고, 자동화된 작업 계획기를 통해 실행 가능한 작업 계획을 생성한다.
이 연구는 LLM 기반 로봇 작업 계획에 인간 인식을 통합하는 새로운 접근 방식을 제시하며, 동적 환경에서 로봇의 능동적인 의사 결정을 가능하게 한다.
Stats
최근 대형 언어 모델(LLM)의 발전으로 다양한 연구 분야에서 혁신이 일어나고 있다.
LLM을 활용하여 로봇 작업 및 동작 계획(TAMP) 성능이 크게 향상되었다.
그러나 기존 접근 방식은 동적 환경, 즉 인간의 존재를 고려하지 않는 경우가 많았다.
Quotes
"최근 대형 언어 모델(LLM) 연구의 돌파구로 인해 여러 연구 분야에서 변혁이 일어났다."
"LLM 통합은 로봇 작업 및 동작 계획(TAMP) 성능을 크게 향상시켰다."
"그러나 이전 접근 방식은 동적 객체, 즉 인간의 존재를 종종 무시했다."