本論文では、ランダムサーチによるハイパーパラメータチューニングの過程を正確に把握し、モデル間の比較を信頼性高く行うための手法を提案している。
まず、チューニング曲線と呼ばれる指標を用いて、チューニング努力に応じたモデルの性能を表す。従来の点推定値では、データ量が少ない場合に誤った結論を導く可能性があるが、本手法では信頼区間を併せて提示することで、結論の信頼性を高めている。
具体的には、累積分布関数の非parametric な上限と下限を求め、それらを代数的に変換してチューニング曲線の信頼区間を導出する。この信頼区間は、同時カバレッジ保証と分布非依存性を持つ。
実験では、従来手法であるブートストラップ法が信頼区間の正しい coverage を達成できないのに対し、提案手法は理論通りの coverage を示すことを確認している。また、チューニング曲線の推定量の選択や、平均よりも中央値の方が有用であることなども示している。
最後に、サンプルサイズとチューニング曲線の関係を分析し、所望の精度を得るために必要なサンプル数の目安を示している。
toiselle kielelle
lähdeaineistosta
arxiv.org
Tärkeimmät oivallukset
by Nicholas Lou... klo arxiv.org 04-10-2024
https://arxiv.org/pdf/2311.09480.pdfSyvällisempiä Kysymyksiä