핵심 개념
본 논문에서는 3D 공간 정보와 적응형 동작 계획을 결합하여 다양한 물체를 효과적으로 픽킹할 수 있는 SuctionPrompt라는 새로운 로봇 조작 시스템을 제안합니다.
초록
SuctionPrompt: 비전-언어 모델과 간편한 하드웨어 설계를 이용한 흡착 컵 기반 시각 보조 로봇 피킹 시스템 연구 논문 요약
Motoda, T., Kitamura, T., Hanai, R., & Domae, Y. (2024). SuctionPrompt: Visual-assisted Robotic Picking with a Suction Cup Using Vision-Language Models and Facile Hardware Design. arXiv preprint arXiv:2410.23640.
본 연구는 비전-언어 모델(VLM)과 흡착 컵 기반 그리퍼를 활용하여 다양한 물체를 픽킹할 수 있는 SuctionPrompt라는 새로운 로봇 조작 시스템을 개발하는 것을 목표로 합니다. 특히, 본 연구는 편의점과 같은 복잡하고 역동적인 환경에서 제품 픽킹 작업을 수행하기 위해 VLM의 프롬프팅 기술과 3D 감지를 결합하는 데 중점을 둡니다.