リスク感応型マルチエージェント強化学習では、単純に既存の後悔を使うと、最もリスク感応的なエージェントに有利な均衡バイアスが生じる。そのため、リスク感応性を考慮した新しい後悔の定義を提案し、これを最小化するアルゴリズムを開発した。