Core Concepts
リスク感応的な目的関数を最大化するための最適な意思決定ポリシーを導出する。
Abstract
本論文は、固定された期間にわたる意思決定プロセスを扱う。意思決定者は複数の選択肢の中から選択し、その結果によって累積価値が更新される。目的関数は期待対数成長率と対数成長率の分散の組み合わせであり、リスク回避パラメータによってリスクの影響が調整される。
最適性の必要条件を導出し、最適な意思決定ポリシーを特徴付けた。最適ポリシーは、リスク回避パラメータの増加に伴って、より保守的な選択肢に傾倒する傾向にある。
2つの具体例、すなわち最適賭博と小売在庫管理の問題を示し、理論的な結果を検証した。これらの例は、提案されたフレームワークの実用性と適用範囲の広さを示している。
Stats
意思決定者の累積価値は、選択した代替案の収益率の積によって更新される。
代替案の収益率は、確定的な選択肢と確率的な選択肢から構成される。
確率的な選択肢の収益率は、既知の確率分布に従う。
Quotes
"本論文は、リスク感応的な意思決定問題を研究する。これは、期待対数成長率と対数成長率の分散の組み合わせからなる目的関数を最大化する問題として定式化される。"
"最適性の必要条件を導出し、最適な意思決定ポリシーを特徴付けた。最適ポリシーは、リスク回避パラメータの増加に伴って、より保守的な選択肢に傾倒する傾向にある。"