核心概念
Durch die Kombination von menschlicher und maschineller Wahrnehmung wird die Interpretierbarkeit eines Gesichtsverifikationsalgorithmus erhöht, um die Entscheidungsfindung transparenter und verständlicher für Menschen zu gestalten.
摘要
Die Studie präsentiert einen modellunabhängigen Ansatz, um die Wahrnehmung von Maschinen bei Gesichtsvergleichsaufgaben besser zu verstehen und mit menschlichen Konzepten in Einklang zu bringen.
Zunächst wird mithilfe von Mediapipe eine semantische Segmentierung des Gesichts in 13 Regionen vorgenommen. Anschließend wird die Wichtigkeit dieser Regionen für das Modell unter Verwendung von KernelSHAP ermittelt. Basierend darauf werden zwei Algorithmen zur Ähnlichkeitsberechnung eingeführt:
- Einzelne Entfernung (S0): Hier wird jeweils eine Gesichtsregion entfernt und die Auswirkung auf den Ähnlichkeitswert beobachtet.
- Gierige Entfernung (S1): Hier wird iterativ die am stärksten beitragende Region entfernt, bis ein Abbruchkriterium erreicht ist.
Aus den Ergebnissen dieser beiden Algorithmen wird schließlich eine durchschnittliche Ähnlichkeitskarte (SAVG) erstellt, die eine ganzheitliche Interpretation der Modellwahrnehmung ermöglicht.
Die Experimente zeigen, dass der Ansatz in der Lage ist, die Entscheidungsfindung des Modells in Bezug auf die menschlichen Gesichtskonzepte zu erklären. Limitationen bestehen jedoch in Bezug auf starke Kopfposen und Profilansichten.
統計資料
Die Ähnlichkeit zwischen zwei Gesichtsbildern A und B wird durch den Kosinus-Ähnlichkeitswert SA
B berechnet.
Der Unterschied zwischen dem ursprünglichen Ähnlichkeitswert SA
B und dem Wert nach Entfernung einer Gesichtsregion SA(n)
B(n) wird als ∆S bezeichnet.
引述
"Durch die Kombination von menschlicher und maschineller Wahrnehmung wird die Interpretierbarkeit eines Gesichtsverifikationsalgorithmus erhöht, um die Entscheidungsfindung transparenter und verständlicher für Menschen zu gestalten."
"Basierend auf den Ergebnissen dieser beiden Algorithmen wird schließlich eine durchschnittliche Ähnlichkeitskarte (SAVG) erstellt, die eine ganzheitliche Interpretation der Modellwahrnehmung ermöglicht."