Core Concepts
人間中心の目標を最適化するために、オフライン強化学習を使用して、AI支援意思決定をモデル化する方法。
Abstract
この記事は、AI支援が意思決定プロセスにますます組み込まれる中で、個々のスキル向上やタスクへの楽しさなど、意思決定精度以外の人間中心の目標を最適化しようとする試みに焦点を当てています。オフライン強化学習(RL)アプローチが提案され、これらの人間中心の目標を最適化するためにRLエージェントとAI不確実性を考慮した意思決定サポートを提供します。さまざまな実験から得られた結果は、政策が精度を最適化した場合、他の種類のAIサポートと比較して明らかに優れた精度を達成しました。また、学習は精度よりも最適化が難しいことが示されました。
Stats
2つの実験(N = 316およびN = 964)では、政策が精度を最適化した場合、他の種類のAIサポートと比較して明らかに優れた精度および人間-AI補完性が得られました。
学習を最適化することは精度よりも難しいことが示されました。
Quotes
"Optimized policies will result in human performance on the target objectives (i.e., accuracy and learning) that is as good or better than the performance achieved with baseline policies."
"Our instantiation of the proposed approach is consistently successful in improving joint human-AI accuracy, achieving even human-AI complementarity, but only partially successful in improving human learning."