Der Artikel stellt einen neuartigen Ansatz namens Personalized Grasping Agent (PGA) vor, um Roboter in die Lage zu versetzen, persönliche Objekte eines Nutzers basierend auf minimaler Interaktion zu erkennen und zu greifen.
Zunächst konstruiert PGA eine "Reminiszenz" - eine Sammlung unmarkierter Bilder aus der Umgebung des Nutzers. Dann erwirbt PGA Informationen über persönliche Objekte in zwei Schritten: Durch Interaktion zwischen Mensch und Roboter, bei der der Nutzer ein persönliches Objekt vorstellt, und durch Interaktion zwischen Roboter und Objekt, bei der der Roboter das Objekt aus verschiedenen Perspektiven untersucht.
Basierend auf den so erworbenen Informationen wendet PGA einen Algorithmus zur Propagation von Kennzeichnungen an, um die unmarkierten Objekte in der Reminiszenz zu pseudo-markieren. Schließlich nutzt PGA die Daten aus den Interaktionen und die pseudo-markierten Objekte, um ein personalisiertes Objekterkennungsmodell anzupassen, mit dem es persönliche Objekte effizient erkennen und greifen kann.
Die Experimente zeigen, dass PGA deutlich bessere Ergebnisse erzielt als Basislinien-Methoden, die nur auf einer einzigen Beispielinteraktion pro Objekt trainiert werden. Sogar im Vergleich zu einer vollständig überwachten Methode, die auf 9.000 annotierten Beispielen trainiert wird, erreicht PGA vergleichbare Leistung. Darüber hinaus wird die Praxistauglichkeit von PGA durch den Einsatz auf einem physischen Roboter demonstriert.
A otro idioma
del contenido fuente
arxiv.org
Ideas clave extraídas de
by Junghyun Kim... a las arxiv.org 03-20-2024
https://arxiv.org/pdf/2310.12547.pdfConsultas más profundas