Erkennung und Lokalisierung von Anweisungsfehlern in der Vision-und-Sprache-Navigation in kontinuierlichen Umgebungen
Dieser Artikel stellt einen neuartigen Benchmark-Datensatz (R2RIE-CE) vor, der verschiedene Arten von Anweisungsfehlern in der Vision-und-Sprache-Navigation in kontinuierlichen Umgebungen (VLN-CE) berücksichtigt. Außerdem definiert er die Aufgabe der Erkennung und Lokalisierung von Anweisungsfehlern und präsentiert eine effektive Methode (IEDL) dafür.