Core Concepts
Ein robustes Cross-Transformers-Netzwerk kann sowohl die Personenerkennung als auch die Suche nach Personenattributen verbessern.
Abstract
In dieser Studie wird CLEAR vorgestellt, ein vereinheitlichtes Modell für die Erkennung und Suche nach Personenattributen. CLEAR verwendet ein robustes Cross-Transformers-Netzwerk, um globale und lokale Langstreckenabhängigkeiten zu nutzen und die Personenerkennung zu verbessern. Eine effektive Strategie zur Anpassung an die Suchaufgabe wird eingeführt, indem Konzepte wie eine Kombination aus einer weichen Einbettungsabfrage und einer harten Einbettungsabfrage integriert werden. Anschließend hilft eine effiziente Margin-Learning-Strategie dem vereinheitlichten Modell, überlegene Ergebnisse in der Suchaufgabe zu erzielen. Experimente an häufig verwendeten Datensätzen zeigen, dass unser CLEAR-Modell auf beiden Aufgaben Spitzenleistungen erzielt und die Benchmarks für die Suchaufgabe erheblich verbessert.
Struktur:
Einleitung
Personenerkennung
Suche nach Personenattributen
Experimentelle Ergebnisse
Ablationsstudie
Qualitative Ergebnisse
Stats
In dieser Studie wird CLEAR vorgestellt, ein vereinheitlichtes Modell für die Erkennung und Suche nach Personenattributen.
Quotes
"Ein robustes Cross-Transformers-Netzwerk kann sowohl die Personenerkennung als auch die Suche nach Personenattributen verbessern."