核心概念
Durch den Einsatz von Reinforcement Learning können einfache und interpretierbare Tipps abgeleitet werden, die die Leistung von Menschen bei sequentiellen Entscheidungsproblemen signifikant verbessern können.
摘要
Die Studie untersucht, wie Menschen Tipps, die mit Hilfe von Reinforcement Learning abgeleitet wurden, in ihre Entscheidungsfindung integrieren können. Dafür wurde ein virtuelles Küchenmanagement-Spiel entwickelt, in dem Teilnehmer sequentielle Entscheidungen treffen müssen.
In Phase I wurde Trace-Daten von Teilnehmern gesammelt, um Tipps abzuleiten. In Phase II wurden Teilnehmer zufällig in verschiedene Bedingungen eingeteilt, in denen sie unterschiedliche Tipps erhielten (von unserem Algorithmus, von anderen Teilnehmern oder einen Baseline-Tipp).
Die Ergebnisse zeigen, dass die von unserem Algorithmus abgeleiteten Tipps die Leistung der Teilnehmer deutlich verbessern können, insbesondere in der schwierigeren, gestörten Konfiguration. Dabei passen die Teilnehmer die Tipps nicht einfach blind an, sondern kombinieren sie mit ihren eigenen Erfahrungen, um zusätzliche Strategien zu entwickeln.
統計資料
"Die Teilnehmer, denen unser Tipp gezeigt wurde, beendeten die letzte Runde in der normalen Konfiguration im Durchschnitt in 22,5 Schritten, was deutlich besser ist als die Kontrollgruppe (24,9 Schritte) sowie die Gruppen mit dem Tipp von Menschen (24,3 Schritte) und dem Baseline-Tipp (24,6 Schritte)."
"In der gestörten Konfiguration beendeten die Teilnehmer mit unserem Tipp die letzte Runde im Durchschnitt in 37,1 Schritten, was deutlich besser ist als die Kontrollgruppe (42,4 Schritte), die Gruppe mit dem Tipp von Menschen (40,5 Schritte) und die Gruppe mit dem Baseline-Tipp (40,1 Schritte)."
引述
"Unsere Tipps können die Leistung der Teilnehmer signifikant verbessern, da sie Strategien erfassen, die für Teilnehmer schwer zu lernen sind."
"Die Teilnehmer passen die Tipps nicht einfach blind an, sondern kombinieren sie mit ihren eigenen Erfahrungen, um zusätzliche Strategien zu entwickeln."