이 연구는 호기심 많은 로봇이 물리적 세계를 탐험하며 자율적으로 범주를 발견하고 이를 상징적으로 접지하는 과정을 다룹니다.
실험에서 로봇은 Cozmo 로봇을 사용하며, Explauto 프레임워크를 통해 호기심을 모델링합니다. 로봇은 시각적 입력을 통해 물체를 감지하고 YOLO+CLIP, SAM+DINOv2와 같은 파이프라인을 사용하여 물체의 시각적 특징을 표현합니다.
실험 1에서는 YOLO+CLIP 파이프라인을 사용하여 고차원 시각 공간을 감지하고, 실험 2에서는 코사인 유사도 기반 영역 분할을 도입합니다. 실험 3에서는 SAM+DINOv2 파이프라인을 사용하여 더 복잡한 환경에서의 범주 발견을 시도합니다.
실험 결과, 로봇은 자율적으로 물리적 세계의 범주를 발견하고 이를 상징적으로 접지할 수 있음을 보여줍니다. 이는 아동의 언어 습득 과정을 모방하는 것으로, 기존의 상향식 접근법과 차별화됩니다.
To Another Language
from source content
arxiv.org
Key Insights Distilled From
by Catherine He... at arxiv.org 04-05-2024
https://arxiv.org/pdf/2404.03092.pdfDeeper Inquiries