Kernkonzepte
Post-Selection in machine learning is statistically invalid, even with cross-validation.
Zusammenfassung
この論文は、深層学習における不正行為とポスト選択の分析に焦点を当てています。著者は、一般的なクロスバリデーション原則が社会科学のいくつかの問題にも適用できる可能性があることを示唆しています。ポスト選択は、単一のランダムサンプルだけを扱い、FとVの空間でバイアスを持つことから統計的に無効であることが証明されました。NNWTやPGNNなどの手法は、入力および出力両方でクロスバリデーションを使用しても未来テストに対して誤った低い検証エラーを提供し、Super Learnerなど他の候補分類器は実用的ではない可能性があります。
Statistiken
本論文では、2007年にvan der Laanらが提案した「Super Learner」モデルが言及されています。
ニューラルネットワークモデル「NNWT」と「PGNN」は入力クロスバリデーションでゼロ検証エラーを示すことが証明されています。
クロスバリデーションにより、全体的な平均パフォーマンスが得られます。
ポスト選択は統計的に無効であり、将来テストへの期待されるパフォーマンスを誇張します。
Zitate
"Post-selection of certain national pride based on a validation set, such as making enemies, violence, and ideologies, appears not optimal for a future test."
"Short-sighted human behaviors are common. A politician would say, 'Regardless of what cost we will pay, we must ...'."