Effiziente Verarbeitung und Analyse von Inhalten mit impliziter und expliziter Sprachführung für diffusionsbasierte visuelle Wahrnehmung
Ein neuartiges Rahmenwerk für implizite und explizite Sprachführung, das die Leistung diffusionsbasierter visueller Wahrnehmungsaufgaben wie semantische Segmentierung und Tiefenschätzung verbessert.