Die Studie untersucht, wie Menschen Tipps, die mit Hilfe von Reinforcement Learning abgeleitet wurden, in ihre Entscheidungsfindung integrieren können. Dafür wurde ein virtuelles Küchenmanagement-Spiel entwickelt, in dem Teilnehmer sequentielle Entscheidungen treffen müssen.
In Phase I wurde Trace-Daten von Teilnehmern gesammelt, um Tipps abzuleiten. In Phase II wurden Teilnehmer zufällig in verschiedene Bedingungen eingeteilt, in denen sie unterschiedliche Tipps erhielten (von unserem Algorithmus, von anderen Teilnehmern oder einen Baseline-Tipp).
Die Ergebnisse zeigen, dass die von unserem Algorithmus abgeleiteten Tipps die Leistung der Teilnehmer deutlich verbessern können, insbesondere in der schwierigeren, gestörten Konfiguration. Dabei passen die Teilnehmer die Tipps nicht einfach blind an, sondern kombinieren sie mit ihren eigenen Erfahrungen, um zusätzliche Strategien zu entwickeln.
לשפה אחרת
מתוכן המקור
arxiv.org
תובנות מפתח מזוקקות מ:
by Hamsa Bastan... ב- arxiv.org 03-20-2024
https://arxiv.org/pdf/2108.08454.pdfשאלות מעמיקות