Core Concepts
제안된 TDANet은 관찰된 물체와 목표 물체 간의 공간적 및 의미적 관계를 학습하여 목표 물체와 가장 관련성이 높은 관찰된 물체에 주목하는 방식으로 제로 샷 능력을 갖춘 물체 목표 시각 네비게이션 정책을 학습한다.
Abstract
본 연구에서는 목표 지향 주의 네트워크(TDANet)를 제안하여 제로 샷 능력을 갖춘 물체 목표 시각 네비게이션 정책을 학습하였다. TDANet은 목표 주의(TA) 모듈을 통해 관찰된 물체와 목표 물체 간의 공간적 및 의미적 관계를 학습하여 목표 물체와 가장 관련성이 높은 관찰된 물체에 주목한다. 또한 시아메즈 아키텍처(SA) 설계를 통해 현재 상태와 목표 상태의 차이를 구분하여 제로 샷 능력을 향상시킨다. 실험 결과, TDANet은 기존 최신 모델들에 비해 높은 네비게이션 성공률과 경로 길이 가중 성공률을 달성하며, 특히 볼 수 없었던 물체에 대한 제로 샷 네비게이션 성능이 크게 향상되었음을 보여준다.
Stats
제안된 TDANet 모델은 기존 최신 모델들에 비해 볼 수 있었던 물체에 대한 네비게이션 성공률이 7.2% 높고, 경로 길이 가중 성공률이 7.8% 높다.
볼 수 없었던 물체에 대한 네비게이션 성공률은 기존 최신 모델들에 비해 28.1% 높고, 경로 길이 가중 성공률은 13.5% 높다.
Quotes
"제안된 TDANet은 관찰된 물체와 목표 물체 간의 공간적 및 의미적 관계를 학습하여 목표 물체와 가장 관련성이 높은 관찰된 물체에 주목한다."
"TDANet은 현재 상태와 목표 상태의 차이를 구분하는 시아메즈 아키텍처 설계를 통해 제로 샷 능력을 향상시킨다."