المفاهيم الأساسية
CMZ-DRIL verbessert die Leistung von Imitationslernagenten mit nur wenigen Expertenvorführungen durch Unsicherheitsminimierung.
الإحصائيات
Dieses Papier präsentiert eine Methode namens Continuous Mean-Zero Disagreement-Regularized Imitation Learning (CMZ-DRIL).
CMZ-DRIL kann leistungsstarke Agenten erzeugen, die sich in mehreren wichtigen Metriken ähnlicher verhalten als primäre vorherige Ansätze.
اقتباسات
"CMZ-DRIL verbessert die Leistung von Imitationslernagenten mit nur wenigen Expertenvorführungen durch Unsicherheitsminimierung."