Temel Kavramlar
大規模かつ分散型の生存データに対して、プライバシー保護と計算負荷の軽減を両立するサブサンプリングベースのCoxモデル推定手法を提案する。
Özet
本研究では、大規模かつ分散型の生存データに対するCoxモデルの推定手法を提案している。
大規模データに対する計算負荷の軽減と、分散データに対するプライバシー保護の両立を目的としている。
最適なサブサンプリング確率を導出し、サブサンプルベースの要約統計量のみを用いて分散サイト間で1回の通信で推定を行う手法を提案した。
提案手法の漸近的性質を理論的に示し、シミュレーション研究と実データ分析により有効性を実証した。
実装を容易にするためのRパッケージ「DsubCox」も提供している。
İstatistikler
提案手法のサブサンプルサイズを増やすと、推定値の標準誤差が小さくなる。
提案手法のサブサンプルサイズを同じにした場合、最適サブサンプリング(OSP)は一様サブサンプリング(UNIF)よりも小さい標準誤差を示す。
提案手法のMSEはUNIFよりも小さい。
提案手法の計算時間はフルデータ法よりも大幅に短い。
Alıntılar
"大規模かつ分散型の生存データに対して、プライバシー保護と計算負荷の軽減を両立するサブサンプリングベースのCoxモデル推定手法を提案する。"
"提案手法の漸近的性質を理論的に示し、シミュレーション研究と実データ分析により有効性を実証した。"
"実装を容易にするためのRパッケージ「DsubCox」も提供している。"