Conceitos Básicos
本論文は、術後患者のフォローアップ管理における統計的順次意思決定アルゴリズムの数学的課題を研究することを目的としている。ストキャスティックバンディット(多腕、コンテキスト依存)は、不確実な環境下で行動を学習し、観測された報酬を最大化するエージェントのモデルである。最適な方策を学習するためには、バンディットアルゴリズムは現在の知識の活用と不確実な行動の探索のバランスを取る必要がある。このようなアルゴリズムは、オンライン広告におけるクリック率の最大化など、大規模データ、低リスクの決定、明確なモデル仮定がある産業応用では広く研究・展開されてきた。一方で、デジタルヘルスケアの推奨には、小さなサンプル、リスク回避的なエージェント、複雑な非パラメトリックモデリングなど、全く新しいパラダイムが必要とされる。
Resumo
本論文では、以下の新しい成果を提示する:
- 安全で任意時間有効な集中度界限(Bregman、経験的Chernoff)の開発
- 可測リスク尺度を用いた新しいリスク認識コンテキストバンディットの枠組みの導入
- 弱い仮定の下での新しい非パラメトリックバンディットアルゴリズム(Dirichlet サンプリング)の分析
これらの理論的保証に加え、詳細な経験的検証も行っている。最後に、術後フォローアップ推奨の個別化に向けた第一歩として、医師・外科医と共同で、バリアトリック手術後の長期体重推移を予測する解釈可能な機械学習モデルを開発した。
Estatísticas
術後フォローアップの平均スコアと標準偏差: 外科手術科(80 ± 10)、一般開業医(85 ± 20)、電子相談(?)
バリアトリック手術後の5年間の体重推移を予測するための機械学習モデルの開発
Citações
"より応用的に行けば、より強力な理論が必要になる" - Odalric-Ambrym Maillard