Tiefe integrierte Sprache für die Segmentierung von Referenzbildern: Kalibrierung und Rekonstruktion
Das Ziel ist es, die feingranulare semantische Information effizient von den Textmerkmalen auf die visuellen Merkmale zu übertragen, um die Genauigkeit der Segmentierung von Referenzbildern zu verbessern.