Der Artikel stellt JEANIE, ein Verfahren zur Ähnlichkeitsmessung von 3D-Skelettsequenzen, vor. JEANIE führt eine gemeinsame zeitliche und perspektivische Ausrichtung von Abfrage- und Unterstützungssequenzen durch, um Variationen in Geschwindigkeit, Zeitpunkt und Körperhaltung zu berücksichtigen.
Zunächst werden die Skelettsequenzen in kurze zeitliche Blöcke unterteilt und durch ein Netzwerk aus Graph-Neuronalen-Netzen (GNN) und optionalem Transformer-Modul codiert. JEANIE sucht dann den optimalen Pfad zur gemeinsamen zeitlichen und perspektivischen Ausrichtung der Abfrage- und Unterstützungssequenzen, indem es die Ähnlichkeit der codierten Blöcke unter verschiedenen simulierten Kameraansichten minimiert.
JEANIE wird sowohl in einem überwachten als auch in einem unüberwachten Few-Shot-Bewegungserkennungsszenario evaluiert. Im überwachten Szenario dient JEANIE als Ähnlichkeitsmaß in einer Verlustfunktion, die die Ähnlichkeit innerhalb einer Klasse maximiert und die Ähnlichkeit zwischen Klassen minimiert. Im unüberwachten Szenario wird JEANIE als Distanzmaß in einem Dictionary-Lernansatz verwendet, um Sequenzen ohne Klassenlabels zu gruppieren.
Die Experimente zeigen, dass JEANIE den Stand der Technik auf großen Benchmarks wie NTU-60, NTU-120, Kinetics-Skelett und UWA3D Multiview Activity II übertrifft.
To Another Language
from source content
arxiv.org
Key Insights Distilled From
by Lei Wang,Jun... at arxiv.org 03-26-2024
https://arxiv.org/pdf/2402.04599.pdfDeeper Inquiries