Der Artikel befasst sich mit dem Problem der schwach überwachten tiefen Quantisierung für die Bildsuche. Dazu werden die folgenden Schlüsselpunkte behandelt:
Tagsemantik-Verbesserung: Es wird ein Tagkorrelationsgraph aufgebaut, um die semantischen Informationen der Tags zu verbessern und die Spärlichkeit zu reduzieren.
Quantisierung auf der semantischen Hypersphäre: Die tiefen Bildmerkmale werden auf eine Hypersphäre abgebildet, um die Normvarianz zu reduzieren. Zwei neuartige Cosinusverluste werden entwickelt, um die semantische Erhaltung in den Quantisierungscodes zu verbessern.
Schwach überwachtes Lernen: Im Gegensatz zu bestehenden tiefen Quantisierungsmethoden, die stark von manuell annotierten Daten abhängen, versucht der Ansatz, aus frei verfügbaren Webbildern mit unreinen Tags zu lernen.
Experimente zeigen, dass der vorgeschlagene Ansatz WSDHQ im schwach überwachten Szenario zu state-of-the-art-Ergebnissen bei der Bildsuche führt.
Іншою мовою
із вихідного контенту
arxiv.org
Ключові висновки, отримані з
by Jinpeng Wang... о arxiv.org 04-09-2024
https://arxiv.org/pdf/2404.04998.pdfГлибші Запити