핵심 개념
提案されたクラム法は、同時学習と評価を効率的に行う手法であり、サンプル分割よりもデータ効率が高いことが示されています。
초록
クラム法は、一連のバッチデータを使用してポリシーを学習し、その有効性を評価する方法です。
クラム法は、サンプル分割よりも評価標準誤差を40%以上減少させることが示されています。
ランダム化臨床試験データに適用した結果では、クラム法の方がサンプル分割よりも有意なポリシー値を持っています。
통계
提案された方法は、サンプル分割よりも40%以上の評価標準誤差の低下を実証しています。
인용구
"提案された方法は、同時学習と評価を効率的に行う手法であり、サンプル分割よりもデータ効率が高いことが示されています。"