Denoised Imitation Learning basierend auf Domain Adaptation: Effiziente Verarbeitung von verrauschten Expertendemonstrationen
DIDA entwirft zwei Diskriminatoren, um den Rauschpegel und das Expertenniveau der Daten zu unterscheiden, um einen Merkmalsencoder zu erlernen, der aufgabenbezogene, aber domänenunabhängige Darstellungen lernt.