Core Concepts
Sichere und erklärbare Planung (SEP) überbrückt die Lücke zwischen den Erwartungen des Menschen und dem optimalen Verhalten des KI-Agenten, indem es Sicherheit und Erklärbarkeit gleichzeitig berücksichtigt.
Abstract
Der Artikel führt das Problem der sicheren und erklärbaren Planung (SEP) ein, das eine Erweiterung des Problems der erklärbaren Planung ist, um eine Sicherheitsgrenze zu unterstützen. Die Formulierung von SEP verallgemeinert die Berücksichtigung mehrerer Ziele, die in herkömmlichen MOMDPs oder CMDPs behandelt werden, auf mehrere Modelle.
Die Lösung von SEP ist eine sichere und erklärbare Politik, die die Sicherheitsgrenze erfüllt, während die Erklärbarkeit maximiert wird. Der Artikel schlägt eine Aktion-Pruning-Technik vor, um den Suchraum zu reduzieren, eine exakte Methode, um die Pareto-Menge der Politiken zu finden, und eine gierige Methode, um eine einzelne Politik in der Pareto-Menge zu finden. Außerdem werden Näherungslösungen durch Zustandsaggregation basierend auf Zustandsmerkmalen und Aktionsauswahl diskutiert, um die Skalierbarkeit zu verbessern.
Die Evaluierung durch Simulationen und physische Roboterexperimente bestätigt die Wirksamkeit des Ansatzes für sichere und erklärbare Planung.
Stats
Die optimale Rendite im Modell des Agenten beträgt 94.
Die Rendite des Trajektors mit dem längsten Umweg (d.h. so weit wie möglich vom Rand entfernt), ohne vom Abgrund zu fallen, beträgt 90.
Quotes
"Sichere Erklärbarkeit kann Risiken in Mensch-Roboter-Interaktionsszenarien mindern, indem es gefährliche Ergebnisse verhindert."
"SEP priorisiert Sicherheit, ohne Erklärbarkeit zu opfern."