Główne pojęcia
人間の行動は最適ではなく、状況に応じて系統的な非最適性を示す。状態依存的な合理性に基づくボルツマンモデルを提案し、人間の行動をより正確にモデル化する。
Streszczenie
本論文は、人間の行動をより正確にモデル化するために、状態依存的な合理性に基づくボルツマンモデルを提案している。
従来のボルツマン合理性モデルでは、人間の行動の非最適性を一定の定数βで表現していたが、本論文では、βを状態sの関数β(s)とすることで、より自然な表現が可能になる。
具体的には、報酬関数Uと状態依存的な非最適性βを同時に学習するモデルを提案している。これにより、人間の行動の系統的な非最適性を捉えることができる。
理論的な導出と共に、いくつかの実験設計を示しており、人間の行動モデルの回復、目標推定などの応用を検討している。しかし、実験結果は示されていない。
今後の課題として、状態表現の学習、より複雑な非最適性モデルの検討、実際の人間データを用いた検証などが挙げられている。
Statystyki
人間の行動は最適ではなく、状況に応じて系統的な非最適性を示す
状態依存的な合理性に基づくボルツマンモデルを提案し、報酬関数Uと状態依存的な非最適性βを同時に学習する
Cytaty
"人間の行動は最適ではなく、状況に応じて系統的な非最適性を示す"
"状態依存的な合理性に基づくボルツマンモデルを提案し、報酬関数Uと状態依存的な非最適性βを同時に学習する"