Centrala begrepp
ディープラーニングの実用性を向上させるために、情報理論的原則に基づくアクティブラーニングとアクティブサンプリングの技術を調査する。
Sammanfattning
この論文は、ディープラーニングモデルのラベル効率性とトレーニング効率性を向上させることを目指しています。既存の方法がヒューリスティックに依存している一方で、この論文は情報理論に基づいたより原則的なアプローチを追求し、データサブセット選択のさまざまな目標とその応用を探求しています。エピステミックおよびアレイタリック不確実性を単一前方パス深層ニューラルネットワークで分離し、アクティブラーニングや(Bayesian)深層学習におけるデータサブセット選択のさまざまな手法を提案・調査します。また、既存および提案された手法を重み空間または予測空間での情報量の近似に関連付けます。情報理論的量に対する原則的かつ実践的な表記法がこの作業の基盤となっており、統一した視点から取り組む利点を示し、私たちの貢献がディープラーニングの実用応用へ与える潜在的影響を強調しています。
Statistik
データサブセット選択技術
ラベル取得コスト
トレーニング効率
Citat
"Deep learning models have yet to gain a strong foothold outside big tech, maybe due to issues such as lack of interpretability, robustness, and generalization guarantees."
"Active learning improves label efficiency, while active sampling enhances training efficiency."
"This thesis aims to address some of these challenges and make deep learning more accessible by reducing the costs of gathering and labeling data, speeding up training, and doing so in a principled fashion."