機械学習(ML)は予測モデリングに強力なツールを提供し、サンプルレベルの予測を約束するが、適切に実装および評価されない場合、MLパイプラインにはリークが含まれる可能性があります。これは楽観的な性能推定や新しいデータへの一般化の失敗をもたらす可能性があり、深刻な財政的および社会的影響をもたらすことがあります。本稿では、MLパイプラインの設計、実装、評価時に生じる原因に焦点を当て、具体例を挙げながらさまざまな種類のリークについて包括的な概要と議論を提供します。
Başka Bir Dile
kaynak içeriğinden
arxiv.org
Önemli Bilgiler Şuradan Elde Edildi
by Leon... : arxiv.org 03-06-2024
https://arxiv.org/pdf/2311.04179.pdfDaha Derin Sorular