Die Studie präsentiert einen modellunabhängigen Ansatz, um die Wahrnehmung von Maschinen bei Gesichtsvergleichsaufgaben besser zu verstehen und mit menschlichen Konzepten in Einklang zu bringen.
Zunächst wird mithilfe von Mediapipe eine semantische Segmentierung des Gesichts in 13 Regionen vorgenommen. Anschließend wird die Wichtigkeit dieser Regionen für das Modell unter Verwendung von KernelSHAP ermittelt. Basierend darauf werden zwei Algorithmen zur Ähnlichkeitsberechnung eingeführt:
Aus den Ergebnissen dieser beiden Algorithmen wird schließlich eine durchschnittliche Ähnlichkeitskarte (SAVG) erstellt, die eine ganzheitliche Interpretation der Modellwahrnehmung ermöglicht.
Die Experimente zeigen, dass der Ansatz in der Lage ist, die Entscheidungsfindung des Modells in Bezug auf die menschlichen Gesichtskonzepte zu erklären. Limitationen bestehen jedoch in Bezug auf starke Kopfposen und Profilansichten.
To Another Language
from source content
arxiv.org
Key Insights Distilled From
by Miriam Doh (... at arxiv.org 03-15-2024
https://arxiv.org/pdf/2403.08789.pdfDeeper Inquiries