Основные понятия
Dieser Artikel diskutiert die Herausforderungen bei der Verifizierung ethischer Entscheidungssysteme für KI-Agenten und schlägt zwei Kategorien von Eigenschaften vor, die solche Systeme erfüllen sollten.
Аннотация
Der Artikel befasst sich mit der Frage, wie man die Korrektheit von Systemen für maschinelle Ethik verifizieren kann. Dies ist eine Herausforderung, da es in der Ethik oft keine eindeutig "richtigen" Antworten gibt.
Der Artikel präsentiert zunächst ein Beispiel aus dem Bereich der "Smart Home"-Systeme, bei dem die Implementierung der Prinzipien der "Doppelwirkung" zu unerwarteten Ergebnissen führt. Dies zeigt, dass die bloße Einholung von Stakeholder-Zustimmung nicht ausreicht, um die Korrektheit solcher Systeme sicherzustellen.
Daraufhin werden zwei Kategorien von Eigenschaften vorgeschlagen, die man für die Verifizierung von Systemen für maschinelle Ethik berücksichtigen sollte:
Eigenschaften, um die Korrektheit des Implementierungsmechanismus der ethischen Entscheidungsfindung zu überprüfen. Hier geht es darum, nachzuweisen, dass das System immer die am wenigsten unethische Handlung wählt.
Eigenschaften, um sicherzustellen, dass die richtigen ethischen Regeln identifiziert wurden. Hier werden spezifische Szenarien verwendet, um zu überprüfen, ob das System in diesen Situationen die korrekte Handlung auswählt.
Der Artikel präsentiert Beispiele für beide Kategorien von Eigenschaften und deren Verifizierung mithilfe formaler Methoden.
Статистика
Es gibt keine expliziten Zahlen oder Statistiken in diesem Artikel.
Цитаты
"Wenn wir nicht einmal die korrekte Ausgabe für einige spezifische Eingaben definieren können, wie können wir dann allgemeinere Eigenschaften für diese Systeme formalisieren?"
"Manchmal können diese Eigenschaften auf allgemeine Szenarien Bezug nehmen, die sich auf eine hohe Ebene einer Eigenschaft beziehen - zum Beispiel haben wir versucht, zu verifizieren, dass das System im Falle eines Brandes immer evakuiert, unabhängig davon, ob es Tag oder Nacht ist oder was sonst noch im Hintergrundset b auftaucht."