Core Concepts
DROID는 76,000개의 다양한 로봇 조작 데모 트레이어리를 포함하며, 564개의 장면과 86개의 작업을 다룹니다. 이를 통해 더 강력하고 일반화된 로봇 조작 정책을 학습할 수 있습니다.
Abstract
DROID는 대규모 로봇 조작 데이터셋으로, 76,000개의 데모 트레이어리 또는 350시간의 상호작용 데이터를 포함합니다. 이는 564개의 장면, 52개의 건물, 86개의 작업에서 수집되었으며, 13개 기관의 50명의 데이터 수집자들이 12개월 동안 수집했습니다. 각 에피소드에는 3개의 동기화된 RGB 카메라 스트림, 카메라 보정, 깊이 정보, 자연어 지침이 포함되어 있습니다.
실험 결과, DROID로 학습한 정책은 기존 대규모 데이터셋 대비 20% 더 높은 성능과 일반화 능력을 보였습니다. DROID 전체 데이터셋, 정책 학습 코드, 로봇 하드웨어 설정 가이드를 공개합니다.
Stats
76,000개의 데모 트레이어리를 포함하고 있습니다.
564개의 장면과 52개의 건물에서 수집되었습니다.
86개의 작업(동사)을 다루고 있습니다.
13개 기관의 50명의 데이터 수집자가 12개월 동안 데이터를 수집했습니다.
Quotes
"DROID는 76,000개의 다양한 로봇 조작 데모 트레이어리를 포함하며, 564개의 장면과 86개의 작업을 다룹니다."
"DROID로 학습한 정책은 기존 대규모 데이터셋 대비 20% 더 높은 성능과 일반화 능력을 보였습니다."