Основные понятия
Das inverse Verstärkungslernen ist hochsensibel gegenüber Fehlspezifikationen von Verhaltensmodellen.
Статистика
Sehr milde Fehlspezifikationen können zu großen Fehlern in der abgeleiteten Belohnungsfunktion führen.
Keine Metriken oder wichtigen Zahlen zur Unterstützung der Schlüssellogik.
Цитаты
"Das inverse Verstärkungslernen ist hochsensibel gegenüber Fehlspezifikationen von Verhaltensmodellen."