Die Studie befasst sich mit dem Problem der dexteren funktionalen Vorgriffmanipulation, bei der ein Roboterarm und eine dextere Hand ein Objekt so manipulieren müssen, dass eine spezifische funktionale Griffpose erreicht wird. Dies erfordert präzise Kontrolle über relative Position, relative Orientierung und Kontakt zwischen Hand und Objekt, während gleichzeitig eine Verallgemeinerung auf diverse dynamische Szenarien mit unterschiedlichen Objekten und Zielstellungen erreicht werden muss.
Um diese Herausforderung zu bewältigen, verwenden die Autoren einen Lehrer-Schüler-Lernansatz. Sie schlagen eine neuartige gegenseitige Belohnung vor, die Agenten dazu anregt, drei Schlüsselkriterien gemeinsam zu optimieren. Außerdem führen sie eine Pipeline ein, die eine Mischung aus Experten-Strategie nutzt, um diverse Manipulationsrichtlinien zu lernen, gefolgt von einer Diffusionspolitik, um komplexe Aktionsverteilungen aus diesen Experten zu erfassen.
Das vorgeschlagene Verfahren erreicht eine Erfolgsquote von 72,6% über mehr als 30 Objektkategorien mit 1400+ Objekten und 10.000+ Zielstellungen. Es verwendet dabei ausschließlich Objektpositionsinformationen für die universelle dextere funktionale Vorgriffmanipulation, indem es extrinsische Dexterität nutzt und auf Feedback reagiert. Zusätzliche Experimente unter verrauschter Objektpositionsbeobachtung zeigen die Robustheit des Verfahrens und sein Potenzial für Anwendungen in der realen Welt.
לשפה אחרת
מתוכן המקור
arxiv.org
תובנות מפתח מזוקקות מ:
by Tianhao Wu,Y... ב- arxiv.org 03-20-2024
https://arxiv.org/pdf/2403.12421.pdfשאלות מעמיקות