Core Concepts
LOTUS ist ein kontinuierlicher Imitationslernalgorithmus, der einem physischen Roboter ermöglicht, kontinuierlich und effizient neue Manipulationsaufgaben im Laufe seiner Lebensdauer zu lernen. Der Kerngedanke hinter LOTUS ist der Aufbau einer ständig wachsenden Fertigkeitenbibliothek aus einer Sequenz neuer Aufgaben mit einer geringen Anzahl von Menschendemonstration.
Abstract
LOTUS besteht aus zwei Hauptprozessen: kontinuierliche Fertigkeitsentdeckung mit offener Weltwahrnehmung und hierarchisches Strategietraining mit der Fertigkeitenbibliothek.
Für die kontinuierliche Fertigkeitsentdeckung verwendet LOTUS ein hierarchisches Clustering auf Basis von DINOv2-Merkmalen, um Zeitabschnitte aus Demonstrationen zu identifizieren und diese inkrementell in Partitionen zu clustern, um entweder bestehende Fertigkeiten zu aktualisieren oder neue Fertigkeiten zu erlernen.
Für das hierarchische Strategietraining verwendet LOTUS eine Meta-Steuerung, die Fertigkeiten aus der kontinuierlich wachsenden Bibliothek auswählt und Zwischenziele für die ausgewählte Fertigkeit generiert. Die Fertigkeitspolitiken werden mit Verhaltensklonierung und Erfahrungsreplikation trainiert, um Wissenstransfer in der kontinuierlichen Lernumgebung zu ermöglichen.
Die umfassenden Experimente zeigen, dass LOTUS die Leistung der State-of-the-Art-Basislinien um über 11% in der Erfolgsquote übertrifft und damit seine überlegene Fähigkeit zum Wissenstransfer im Vergleich zu früheren Methoden demonstriert.
Stats
Die Erfolgsquote von LOTUS ist über 11% höher als die der State-of-the-Art-Basislinien.
Quotes
"LOTUS ist ein kontinuierlicher Imitationslernalgorithmus, der einem physischen Roboter ermöglicht, kontinuierlich und effizient neue Manipulationsaufgaben im Laufe seiner Lebensdauer zu lernen."
"Der Kerngedanke hinter LOTUS ist der Aufbau einer ständig wachsenden Fertigkeitenbibliothek aus einer Sequenz neuer Aufgaben mit einer geringen Anzahl von Menschendemonstration."