Der Artikel präsentiert einen Ansatz, um die 3D-Rotationsdynamik eines starren Körpers mit unbekannter Massenverteilung aus Bildsequenzen zu lernen und vorherzusagen. Das Modell umfasst mehrere Stufen:
Einbettung der Bildbeobachtungen in einen niedrigdimensionalen Latenzraum, der der SO(3)-Struktur des Konfigurationsraums des starren Körpers entspricht.
Berechnung der Dynamik im Latenzraum unter Verwendung einer gelernten Darstellung des Hamiltonoperators. Dazu wird die Lie-Poisson-Gleichung verwendet, um die Winkelgeschwindigkeit und den Drehimpuls des Körpers zu berechnen.
Dekodierung der vorhergesagten Latenzdarstellungen in Bildsequenzen.
Das Modell wird auf neuen synthetischen Datensätzen von rotierenden Objekten (Würfel, Prismen, Satelliten) mit bekannter und unbekannter Massenverteilung evaluiert. Es übertrifft etablierte Basismodelle wie LSTM, Neural ODE und Hamiltonian Generative Network in Bezug auf Vorhersagegenauigkeit und Interpretierbarkeit der gelernten Darstellungen.
To Another Language
from source content
arxiv.org
Key Insights Distilled From
by Justice Maso... at arxiv.org 04-12-2024
https://arxiv.org/pdf/2308.14666.pdfDeeper Inquiries