المفاهيم الأساسية
객체 간 관계를 시간과 공간 차원에서 모델링하여 에이전트의 네비게이션 성능을 향상시킴
الملخص
이 논문은 시각-언어 네비게이션(VLN) 과제에서 객체 간 관계를 모델링하여 에이전트의 네비게이션 능력을 향상시키는 방법을 제안한다.
- 시간 객체 관계(TOR) 모듈: 에이전트의 이동 경로를 따라 객체 간 관계를 학습하여 시간적 연속성을 고려한다.
- 공간 객체 관계(SOR) 모듈: 네비게이션 환경의 모든 관점을 고려하여 객체 간 관계를 구축하여 공간적 완전성을 보장한다.
- 회귀 페널티(TBP) 손실 함수: 에이전트의 반복적인 방문 행동을 억제하여 네비게이션 경로의 효율성을 높인다.
실험 결과, 제안된 방법은 REVERIE, SOON, R2R 데이터셋에서 기존 방법들보다 우수한 성능을 보였다.
الإحصائيات
"에이전트의 평균 경로 길이는 20.25m입니다."
"에이전트의 성공률은 55.31%입니다."
"에이전트의 경로 길이 가중 성공률은 40.37%입니다."
اقتباسات
"객체 간 관계를 시간과 공간 차원에서 모델링하여 에이전트의 네비게이션 성능을 향상시킬 수 있습니다."
"회귀 페널티(TBP) 손실 함수를 통해 에이전트의 반복적인 방문 행동을 억제할 수 있습니다."