Core Concepts
Unser Ansatz zur Vorwärtsdynamik-geführten 4D-Imitation ermöglicht die Erzeugung physikalisch realistischer und menschenähnlicher Reaktionen in Echtzeit.
Abstract
Die Kernidee dieser Arbeit ist es, eine Abbildung zwischen Interaktionszuständen und Reaktoraktionen direkt zu erlernen, um physikalisch plausible Reaktionen zu erzeugen, ohne von der Qualität kinematikbasierter Methoden abhängig zu sein.
Dazu umfasst unser Verfahren vier Hauptkomponenten:
Demonstrations-Generierung: Wir verwenden einen universellen Bewegungsverfolger, um Bewegungserfassungsdaten nahtlos in die Simulationsumgebung zu übernehmen.
Training des Vorwärtsdynamik-Modells: Wir trainieren ein stochastisches Vorwärtsdynamik-Modell, um zukünftige Zustände vorherzusagen, und verwenden dafür einen kontrastiven Verlust.
Iterative Generalist-Spezialist-Lernstrategie: Wir unterteilen den Datensatz in Cluster und trainieren zunächst Spezialisten für jedes Cluster, bevor wir ihr Wissen in einen Generalisten destillieren.
Vorwärtsdynamik-geführtes 4D-Imitationslernen: Wir verwenden das trainierte Vorwärtsdynamik-Modell, um die Vorhersage zukünftiger Zustände in den Imitationslernprozess zu integrieren.
Unsere Experimente auf den InterHuman- und Chi3D-Datensätzen zeigen, dass unser Ansatz die bestehenden Methoden deutlich übertrifft, sowohl in Bezug auf die Qualität der generierten Reaktionen als auch auf die Effizienz der Echtzeit-Inferenz.
Stats
Die Simulation des Vorwärtsdynamik-Modells erfolgt in Echtzeit mit 30 Bildern pro Sekunde, was einer Beschleunigung um den Faktor 33 entspricht.
Quotes
"Unser Ansatz zur Vorwärtsdynamik-geführten 4D-Imitation ermöglicht die Erzeugung physikalisch realistischer und menschenähnlicher Reaktionen in Echtzeit."
"Im Gegensatz zu kinematikbasierten Methoden lernt unser Verfahren eine stabile Abbildung zwischen Interaktionszuständen und Reaktoraktionen, ohne von der Qualität kinematikbasierter Methoden abhängig zu sein."