核心概念
Das inverse Verstärkungslernen ist hochsensibel gegenüber Fehlspezifikationen von Verhaltensmodellen.
統計
Sehr milde Fehlspezifikationen können zu großen Fehlern in der abgeleiteten Belohnungsfunktion führen.
Keine Metriken oder wichtigen Zahlen zur Unterstützung der Schlüssellogik.
引用
"Das inverse Verstärkungslernen ist hochsensibel gegenüber Fehlspezifikationen von Verhaltensmodellen."