Core Concepts
デジタルコンピューターで実装された機械学習モデルの一般化誤差を、離散最適輸送理論に基づいて改善することができる。
Abstract
本論文では、デジタルコンピューターで実装された機械学習モデルの一般化誤差を改善する手法を提案している。
主な内容は以下の通り:
デジタルコンピューターの制約を考慮した上で、一般化誤差と推定誤差の上界を導出した。これらの上界は、入力空間と出力空間の離散的な幾何学的構造に適応的に調整される。
有限メトリック空間上の確率分布の1-Wasserstein距離の濃度不等式を導出した。この結果は、一般化誤差と推定誤差の上界の導出に用いられる。
提案手法を回帰分析と二値分類問題に適用し、従来の手法と比較して、実用的な標本サイズの範囲で一般化誤差の上界が大幅に改善されることを示した。
この改善は、デジタルコンピューターの制約を考慮することで、高次元問題に対する機械学習の成功を説明できる可能性を示唆している。
Stats
デジタルコンピューターで実装された機械学習モデルの一般化誤差は、従来の手法では大きな定数倍となり、実用的な標本サイズでは改善が見られない可能性がある。
提案手法では、入力空間と出力空間の離散的な幾何学的構造を考慮することで、一般化誤差の上界を大幅に改善できる。
回帰分析と二値分類問題の数値実験では、提案手法の上界が従来の手法よりも小さくなることが示された。
Quotes
"デジタルコンピューターで実装された機械学習モデルの一般化誤差を、離散最適輸送理論に基づいて改善することができる。"
"提案手法では、入力空間と出力空間の離散的な幾何学的構造を考慮することで、一般化誤差の上界を大幅に改善できる。"