Die Studie untersucht, wie Menschen Tipps, die mit Hilfe von Reinforcement Learning abgeleitet wurden, in ihre Entscheidungsfindung integrieren können. Dafür wurde ein virtuelles Küchenmanagement-Spiel entwickelt, in dem Teilnehmer sequentielle Entscheidungen treffen müssen.
In Phase I wurde Trace-Daten von Teilnehmern gesammelt, um Tipps abzuleiten. In Phase II wurden Teilnehmer zufällig in verschiedene Bedingungen eingeteilt, in denen sie unterschiedliche Tipps erhielten (von unserem Algorithmus, von anderen Teilnehmern oder einen Baseline-Tipp).
Die Ergebnisse zeigen, dass die von unserem Algorithmus abgeleiteten Tipps die Leistung der Teilnehmer deutlich verbessern können, insbesondere in der schwierigeren, gestörten Konfiguration. Dabei passen die Teilnehmer die Tipps nicht einfach blind an, sondern kombinieren sie mit ihren eigenen Erfahrungen, um zusätzliche Strategien zu entwickeln.
To Another Language
from source content
arxiv.org
Ключові висновки, отримані з
by Hamsa Bastan... о arxiv.org 03-20-2024
https://arxiv.org/pdf/2108.08454.pdfГлибші Запити