本文提出了一種名為 DynaMem 的新型空間語義記憶體架構,用於解決開放世界中開放詞彙移動操控任務所面臨的動態環境挑戰。
변화하는 환경에서 온라인으로 작동 가능한 시공간 의미 메모리인 DynaMem을 통해 모바일 로봇이 사전 정보 없이도 효과적인 탐색 및 조작 작업을 수행할 수 있습니다.
動的な環境変化に対応するオンライン動的時空間セマンティックメモリ DynaMem を提案し、オープンワールドモバイルマニピュレーションにおけるロボットのタスク遂行能力を向上させる。
DynaMem, a novel dynamic spatio-semantic memory system, significantly improves the ability of robots to perform open-world mobile manipulation tasks in dynamic environments by constantly updating its memory with new observations and removing outdated information.
사전 학습된 시각적 특징을 활용한 세계 모델 DINO-WM은 픽셀 공간 재구성 없이도 작업에 구애받지 않는 방식으로 시각적 동역학을 모델링하여 테스트 시 제로샷 계획 수립을 가능하게 한다.
事前学習済み視覚特徴量を用いることで、オフラインデータからタスク非依存のワールドモデルを学習し、ゼロショットプランニングを実現できる。
DINO-WM, a novel method for training task-agnostic world models, leverages pre-trained visual features from DINOv2 to enable zero-shot planning for diverse robotic tasks without relying on expert demonstrations or reward functions.
저비용 RGB-D 카메라와 음향 센서 데이터를 융합하여 실내 환경의 투명 표면을 정확하게 재구성하는 새로운 방법론인 VAIR을 제시합니다.
低コストのRGB-Dカメラと超音波センサーの融合により、屋内シーンにおける透明な表面の正確な3D再構成を実現する新しい手法VAIRを提案する。
VAIR is a novel robotic perception framework that leverages the fusion of low-cost acoustic sensors and RGB-D cameras to enable accurate 3D reconstruction of transparent surfaces in indoor environments, addressing a significant challenge for traditional vision-based robotic navigation systems.