Denk-, Interaktions- und Handlungsrahmen für die nullbasierte Sprachnavigation in der Bildverarbeitung
Der TINA-Rahmen ermöglicht es Agenten, visuelle Informationen genau zu untersuchen und eigenständig wichtige Hinweise in der Umgebung abzufragen, wodurch ihre Wahrnehmungsfähigkeiten verbessert werden. Dieser Ansatz übertrifft bestehende nullbasierte Navigationsmodelle und einige überwachte lernbasierte Methoden, ohne zusätzliches Training zu erfordern.