고정 카메라를 통해 장기적이고 단기적인 인간 활동을 효율적으로 감지하여 로봇의 전역 및 지역 경로 계획에 활용할 수 있다.
본 연구는 대규모 언어 모델(LLM)에서 추출한 공간-객체 관계 지식을 활용하여 물체 목표 탐색 작업의 효율성을 향상시키는 데이터 기반 모듈식 접근법을 제안한다.
본 연구는 대규모 언어 모델(LLM)에서 추출한 공간-객체 관계 지식을 활용하여 다중 모달 입력 기반 객체 목표 탐색 성능을 향상시키는 방법을 제안한다.
본 연구는 대규모 언어 모델(LLM)에서 추출한 공간-객체 관계 지식을 활용하여 다중 모달 입력 기반 객체 목표 탐색 성능을 향상시키는 방법을 제안한다.
GaussNav 프레임워크는 3D 가우시안 스플래팅을 활용하여 장면의 기하학적 정보, 의미론적 정보 및 텍스처 정보를 효과적으로 표현하고, 이를 통해 목표 물체를 정확하게 인식하고 효율적으로 내비게이션할 수 있다.