단일 이미지에서 깊이 추정은 고유한 모호성(예: 스케일)을 가지고 있으며, 텍스트 설명 또한 공간적 배치의 모호성을 가지고 있다. 이 연구는 두 가지 모호성을 보완하여 메트릭 스케일의 깊이 추정을 달성한다.