Die Studie untersucht, wie Menschen Tipps, die mit Hilfe von Reinforcement Learning abgeleitet wurden, in ihre Entscheidungsfindung integrieren können. Dafür wurde ein virtuelles Küchenmanagement-Spiel entwickelt, in dem Teilnehmer sequentielle Entscheidungen treffen müssen.
In Phase I wurde Trace-Daten von Teilnehmern gesammelt, um Tipps abzuleiten. In Phase II wurden Teilnehmer zufällig in verschiedene Bedingungen eingeteilt, in denen sie unterschiedliche Tipps erhielten (von unserem Algorithmus, von anderen Teilnehmern oder einen Baseline-Tipp).
Die Ergebnisse zeigen, dass die von unserem Algorithmus abgeleiteten Tipps die Leistung der Teilnehmer deutlich verbessern können, insbesondere in der schwierigeren, gestörten Konfiguration. Dabei passen die Teilnehmer die Tipps nicht einfach blind an, sondern kombinieren sie mit ihren eigenen Erfahrungen, um zusätzliche Strategien zu entwickeln.
Ke Bahasa Lain
dari konten sumber
arxiv.org
Wawasan Utama Disaring Dari
by Hamsa Bastan... pada arxiv.org 03-20-2024
https://arxiv.org/pdf/2108.08454.pdfPertanyaan yang Lebih Dalam