로봇 하위 작업 분석을 위한 기반 모델의 시간적 및 의미적 평가 지표
최근 작업 및 동작 계획(TAMP) 연구에서는 언어 감독 로봇 궤적 데이터를 활용하여 에이전트의 작업 성공률을 크게 향상시킬 수 있음이 입증되었다. 그러나 이러한 데이터의 부족은 이 방법을 일반적인 사용 사례로 확장하는 데 큰 장애물이 되고 있다. 이를 해결하기 위해 본 연구에서는 최근 대형 언어 모델(LLM) 및 비전 언어 모델(VLM)을 포함한 기반 모델(FM)의 프롬프팅 전략을 활용하여 궤적 데이터를 시간적으로 제한되고 자연어 기반의 설명적 하위 작업으로 자동 분해하는 프레임워크를 제안한다.