Основні поняття
Das inverse Verstärkungslernen ist hochsensibel gegenüber Fehlspezifikationen von Verhaltensmodellen.
Статистика
Sehr milde Fehlspezifikationen können zu großen Fehlern in der abgeleiteten Belohnungsfunktion führen.
Keine Metriken oder wichtigen Zahlen zur Unterstützung der Schlüssellogik.
Цитати
"Das inverse Verstärkungslernen ist hochsensibel gegenüber Fehlspezifikationen von Verhaltensmodellen."