3D 기반 재단 모델을 통해 3D 인식, 추론 및 행동을 통합하고 생성 세계 모델을 구축하여 실제 세계와 더 긴밀하게 연결된 지능형 로봇 에이전트를 구현하고자 한다.
SkillDiffuser는 해석 가능한 기술 학습과 조건부 확산 계획을 통합하여 자연어 지시에 따라 다양한 작업을 수행할 수 있는 계층적 계획 프레임워크를 제안합니다.