본 연구는 대규모 언어 모델과 오픈 어휘 탐지기를 활용하여 기존 반복적 비전-언어 네비게이션 기술의 한계를 극복하고자 한다. 이를 통해 다중 모달 신호 간 대응 관계를 설정하고, 구조화된 옴니그래프 표현을 제안하여 보다 효과적으로 네비게이션 지식을 활용할 수 있게 한다.