מושגי ליבה
クラスタ化データを用いて開発された予測モデルにおいて、クラスタの異質性を考慮しない標準的な予測モデルに対して、leave-one-cluster-out交差検証を近似するためのクラスタ化されたネットワーク情報量規準(NICc)を提案する。
תקציר
クラスタ化データにおける予測モデル選択のためのNICc
本論文は、機械学習分野におけるモデル選択、特にクラスタ化データにおける予測モデルの性能評価に関する研究論文である。
本研究は、クラスタ化データにおいて、標準的な予測モデルのleave-one-cluster-out交差検証を近似するための、計算効率の高い情報量規準の開発を目的とする。
標準的な予測モデルのleave-one-observation-out交差検証と漸近的に等価であることが証明されているネットワーク情報量規準(NIC)を出発点とする。
クラスタ化データにおけるleave-one-cluster-out交差検証を近似するために、NICにおけるフィッシャー情報行列を、クラスタリングを調整した推定量で置き換えることで、クラスタ化されたネットワーク情報量規準(NICc)を導出する。
モンテカルロシミュレーションと新生児集中治療室(NICU)の死亡率予測の実際例の両方で、NICc、AIC、BICの性能を比較する。