XPose ist ein neuartiger Rahmen, der Prinzipien des erklärbaren KI (XAI) in die Schätzung der menschlichen Körperhaltung integriert. Ziel ist es, den individuellen Beitrag jedes Schlüsselpunkts zur endgültigen Vorhersage zu erläutern und so die Transparenz und Interpretierbarkeit des Modells zu erhöhen.
Um die hohe Rechenleistung der herkömmlichen Shapley-Wert-Methode zu vermeiden, führt XPose ein innovatives Konzept namens Group Shapley Value (GSV) ein. Dabei werden die Schlüsselpunkte basierend auf ihren Interdependenzen in Cluster eingeteilt. Innerhalb dieser Cluster berechnet GSV sorgfältig den Shapley-Wert für die Schlüsselpunkte, während es für Schlüsselpunkte zwischen den Clustern eine ganzheitlichere Gruppenbewertung vornimmt. Dieses zweistufige Berechnungsrahmenwerk bewertet präzise den Beitrag der Schlüsselpunkte zum Endergebnis und optimiert die Recheneffizienz.
Basierend auf den Erkenntnissen über die Interaktionen der Schlüsselpunkte entwickelt XPose eine neuartige Datenerweiterungstechnik namens Group-based Keypoint Removal (GKR). Dabei werden während der Trainingsphase einzelne Schlüsselpunkte gezielt entfernt, wobei diejenigen mit starken gegenseitigen Verbindungen erhalten bleiben. Dies verfeinert die Vorhersagekraft des Modells für nicht sichtbare Schlüsselpunkte. Die empirische Validierung von GKR über ein Spektrum von Standardansätzen belegt seine Wirksamkeit und zeigt, wie der Einsatz von XAI die Modelle zur Schätzung der Körperhaltung direkt verbessern kann.
إلى لغة أخرى
من محتوى المصدر
arxiv.org
الرؤى الأساسية المستخلصة من
by Luyu Qiu,Jia... في arxiv.org 03-20-2024
https://arxiv.org/pdf/2403.12370.pdfاستفسارات أعمق