Ein neuer kompakter und fragmentierter Datensatz für die Text-Bild-Suche
Der Flickr30K-CFQ-Datensatz bietet eine neue Herausforderung für die Text-Bild-Suche, indem er kompakte und fragmentierte Abfragen anstelle von globalen und formalen Beschreibungen verwendet. Die vorgeschlagene LLM-basierte Abfrageoptimierung verbessert die Leistung bestehender Modelle erheblich.