이 논문에서는 옷 조작을 위한 일반적인 방법으로 의미론적 키포인트를 제안한다. 옷은 복잡한 기하학적 구조와 변형성으로 인해 다양한 옷을 다양한 방식으로 조작하는 일반적인 로봇 시스템을 만드는 것이 어렵다. 이 논문에서는 옷의 특정 구조적 특징(예: "왼쪽 소매")을 의미론적 키포인트로 식별하여 사용한다.
의미론적 키포인트는 작업 계획을 위한 의미론적 단서와 저수준 동작 생성을 위한 기하학적 단서를 제공할 수 있다. 이를 바탕으로 저자들은 대형 언어 모델(LLM)을 사용하는 계층적 학습 프레임워크인 CLASP(CLothes mAnipulation with Semantic keyPoints)를 개발했다.
시뮬레이션 실험에서 CLASP은 기존 방법들보다 다양한 옷 조작 작업에서 우수한 성능을 보였다. 또한 실제 세계 실험에서 CLASP은 다양한 옷에 대해 잘 작동하는 것으로 나타났다. 이 결과는 의미론적 키포인트가 옷 조작을 위한 효과적인 단서를 제공하고, 제안한 계층적 학습 방법이 일반적인 옷 조작 작업에 효과적임을 보여준다.
Na inny język
z treści źródłowej
arxiv.org
Głębsze pytania