Der Artikel befasst sich mit dem Problem der schwach überwachten tiefen Quantisierung für die Bildsuche. Dazu werden die folgenden Schlüsselpunkte behandelt:
Tagsemantik-Verbesserung: Es wird ein Tagkorrelationsgraph aufgebaut, um die semantischen Informationen der Tags zu verbessern und die Spärlichkeit zu reduzieren.
Quantisierung auf der semantischen Hypersphäre: Die tiefen Bildmerkmale werden auf eine Hypersphäre abgebildet, um die Normvarianz zu reduzieren. Zwei neuartige Cosinusverluste werden entwickelt, um die semantische Erhaltung in den Quantisierungscodes zu verbessern.
Schwach überwachtes Lernen: Im Gegensatz zu bestehenden tiefen Quantisierungsmethoden, die stark von manuell annotierten Daten abhängen, versucht der Ansatz, aus frei verfügbaren Webbildern mit unreinen Tags zu lernen.
Experimente zeigen, dass der vorgeschlagene Ansatz WSDHQ im schwach überwachten Szenario zu state-of-the-art-Ergebnissen bei der Bildsuche führt.
Para Outro Idioma
do conteúdo original
arxiv.org
Principais Insights Extraídos De
by Jinpeng Wang... às arxiv.org 04-09-2024
https://arxiv.org/pdf/2404.04998.pdfPerguntas Mais Profundas