Die Studie untersucht, wie taktile Informationen in Imitationslernsysteme integriert werden können, um die Leistung bei komplexen Manipulationsaufgaben wie dem Einstecken von USB-Kabeln zu verbessern.
Die Autoren entwickelten zwei Imitationslernsysteme, Action Chunking Transformers (ACT) und Diffusion Policy, und integrierten taktile Sensoren (GelSight) in diese Systeme. Um die Beziehungen zwischen visuellen und taktilen Informationen zu verstehen, verwendeten sie eine kontrastive Vorverarbeitung, bei der die Encoder für visuelle und taktile Beobachtungen trainiert wurden, um ähnliche Darstellungen für dieselbe Szene und unterschiedliche Darstellungen für verschiedene Szenen zu erzeugen.
Die Experimente zeigten, dass die Verwendung von taktilen Informationen die Leistung bei der Kabelsteckaufgabe deutlich verbesserte, mit einer Erfolgsquote von 95% für das ACT-Modell. Darüber hinaus führte die kontrastive Vorverarbeitung zu einer moderaten Leistungssteigerung der visuo-taktilen Modelle und zu einer signifikanten Verbesserung der rein visuellen Modelle, die eine Leistung auf Augenhöhe mit den visuo-taktilen Modellen erreichten. Die Autoren argumentieren, dass dieser Ansatz insbesondere für industrielle Anwendungen nützlich sein könnte, da er es ermöglicht, die Vorteile taktiler Informationen zu nutzen, ohne taktile Sensoren während des Betriebs einsetzen zu müssen.
In un'altra lingua
dal contenuto originale
arxiv.org
Approfondimenti chiave tratti da
by Abraham Geor... alle arxiv.org 03-19-2024
https://arxiv.org/pdf/2403.11898.pdfDomande più approfondite