Ein multimodaler Datensatz zur Erkennung von Übergabefehlern und Baseline-Methoden
Der Datensatz enthält Fehlschläge bei Objektübergaben zwischen Roboter und Mensch, die durch das Verhalten des menschlichen Teilnehmers verursacht werden. Zwei Baseline-Methoden, eine Videoklassifizierung mit 3D-CNNs und eine zeitliche Aktionssegmentierung, zeigen, dass multimodale Daten wie Video, Kraft-Drehmoment-Sensoren und Greiferzustand wichtig sind, um diese Fehlschläge zu erkennen.