Dieser Artikel stellt einen neuen Datensatz namens "Extreme Pose Face High-Quality Dataset" (EFHQ) vor, der speziell entwickelt wurde, um die Leistung von Gesichtserkennungsmodellen bei extremen Kopfposen zu verbessern. Der Datensatz umfasst bis zu 450.000 hochwertige Bilder von Gesichtern in extremen Posen, die aus zwei öffentlich zugänglichen Datensätzen (VFHQ und CelebV-HQ) extrahiert wurden.
Der Artikel beschreibt zunächst die Motivation für den Datensatz, da bestehende Gesichtsdatensätze meist Bilder mit frontalen Ansichten enthalten, was zu Leistungseinbußen bei Modellen führt, die mit Gesichtern in extremen Posen umgehen müssen. Anschließend wird der Prozess der Datenerstellung erläutert, bei dem verschiedene Kopfposenschätzer kombiniert werden, um robuste Posenlabels zu erhalten.
Der Datensatz wird dann in drei Teilaufgaben evaluiert: Gesichtssynthese, Gesichtsreenactment und Gesichtsverifikation. Die Experimente zeigen, dass der EFHQ-Datensatz die Leistung von Modellen in diesen Aufgaben deutlich verbessert, insbesondere bei extremen Kopfposen. Abschließend werden die Ergebnisse einer Nutzerstudie präsentiert, die die Überlegenheit der mit EFHQ trainierten Modelle bestätigt.
다른 언어로
소스 콘텐츠 기반
arxiv.org
더 깊은 질문