핵심 개념
로봇이 효율적이고 설명 가능한 방식으로 인간 환경에서 작동하려면 주변 환경에 대한 의미 이해가 필요하다. 본 연구에서는 객체 레이블링 및 전체 장면 그래프 생성에 초점을 맞추는 기존 연구와 달리, 대규모 의미 영역을 식별하고 매핑하는 방법을 제안한다.
초록
본 연구는 실내 환경에서 의미 영역 매핑을 위한 방법을 제안한다. 기존 연구는 객체 레이블링과 전체 장면 그래프 생성에 초점을 맞추었지만, 본 연구는 대규모 의미 영역을 식별하고 매핑하는 데 초점을 맞춘다.
제안 방법은 비전-언어 모델을 사용하여 장면 정보를 제공하고, 이를 통해 에고 중심 이해를 전역 좌표계로 투영하여 각 위치에서 가능한 영역 레이블의 분포로 의미 지도를 생성한다. 이 매핑 절차는 자율 매핑을 가능하게 하는 훈련된 탐색 정책과 결합된다.
제안 방법은 객체 기반 시스템과 사전 훈련된 장면 분류기 등 다양한 기준선을 크게 능가한다. 실험은 사실적 시뮬레이터에서 수행되었다.
통계
로봇이 효율적이고 설명 가능한 방식으로 인간 환경에서 작동하려면 주변 환경에 대한 의미 이해가 필요하다.
기존 연구는 객체 레이블링과 전체 장면 그래프 생성에 초점을 맞추었지만, 본 연구는 대규모 의미 영역을 식별하고 매핑하는 데 초점을 맞춘다.
제안 방법은 비전-언어 모델을 사용하여 장면 정보를 제공하고, 이를 통해 에고 중심 이해를 전역 좌표계로 투영하여 의미 지도를 생성한다.
제안 방법은 객체 기반 시스템과 사전 훈련된 장면 분류기 등 다양한 기준선을 크게 능가한다.
인용구
"로봇이 효율적이고 설명 가능한 방식으로 인간 환경에서 작동하려면 주변 환경에 대한 의미 이해가 필요하다."
"기존 연구는 객체 레이블링과 전체 장면 그래프 생성에 초점을 맞추었지만, 본 연구는 대규모 의미 영역을 식별하고 매핑하는 데 초점을 맞춘다."
"제안 방법은 비전-언어 모델을 사용하여 장면 정보를 제공하고, 이를 통해 에고 중심 이해를 전역 좌표계로 투영하여 의미 지도를 생성한다."