Основные понятия
Ein zentraler externer Beobachter kann durch iteratives Abfragen der Reaktionen der Agenten deren private Handlungs-Reaktions-Abbildungen schätzen und daraus ein stationäres Handlungsprofil des zugrunde liegenden mehragentlichen Interaktionsprozesses vorhersagen.
Аннотация
Der Artikel befasst sich mit einem neuartigen Lernproblem, bei dem ein externer Beobachter (oder eine Entität) das Ziel hat, ein stationäres Handlungsprofil in einem mehragentlichen Entscheidungsfindungs- und Steuerungssystem vorherzusagen, in dem die Entscheidungsstrategien der Agenten privat sind.
Der Beobachter kann iterativ Abfragen an die Agenten stellen und deren Reaktionen beobachten, um parametrische Schätzungen der privaten Handlungs-Reaktions-Abbildungen der Agenten zu erstellen. Es werden hinreichende Bedingungen hergeleitet, unter denen diese aktive Lernmethode asymptotisch gegen ein stationäres Handlungsprofil konvergiert. Dies impliziert, dass das Erlernen lokaler Näherungen der Handlungs-Reaktions-Abbildungen dem Beobachter ermöglicht, die Vorhersage des Interaktionsoutcomes erfolgreich durchzuführen. Darüber hinaus dienen die hergeleiteten Bedingungen auch als Nachweis für die Existenz eines stationären Handlungsprofils.
Umfangreiche numerische Simulationen zu typischen mehragentlichen Steuerungs- und Entscheidungsproblemen, einschließlich verallgemeinerter Nash-Spiele und wettbewerblicher linearer Rückkopplungsentwürfe, belegen die praktische Wirksamkeit des vorgeschlagenen lernbasierten Ansatzes.
Статистика
Keine relevanten Statistiken oder Kennzahlen im Artikel enthalten.
Цитаты
Keine markanten Zitate im Artikel enthalten.