대량 언어 모델의 수학적 추론 및 로봇 팔 작업 성능을 향상시키기 위한 프롬프트 선택 및 증강 알고리즘을 제안한다.
D-Cubed은 태스크 독립적인 플레이 데이터셋을 활용하여 학습한 잠재 확산 모델을 통해 복잡한 장기 유연 물체 조작 작업을 위한 최적의 궤적을 생성한다.
이 연구는 점군 관측을 사용하여 다양한 목표 모양을 만들어내는 점토 조각 정책을 직접 학습하는 목표 조건부 확산 기반 모방 학습 프레임워크를 제안한다.