Core Concepts
グラフ依存データにおける一般化誤差の上界を、分数Rademacher複雑度と安定性に基づいて導出する。
Abstract
本論文では、データ間の依存関係がグラフで表現される学習問題を扱っている。
まず、グラフ依存変数に対するMcDiarmid型の濃度不等式を導出する。これらの濃度不等式を用いて、分数Rademacher複雑度と安定性に基づく一般化誤差の上界を導出する。
具体的には以下の通り:
グラフ依存変数に対するMcDiarmid型の濃度不等式を示す。これは分数彩色数を用いて表現される。
分数Rademacher複雑度を定義し、線形関数クラスに対する上界を与える。
分数Rademacher複雑度に基づく一般化誤差の上界を示す。
アルゴリズム安定性に基づく一般化誤差の上界を示す。McDiarmid型の濃度不等式を用いて証明する。
具体的な学習タスク(ランキング、多クラス分類、m-依存データ)への適用例を示す。
本手法は、従来のi.i.d.仮定や混合条件を必要とせず、グラフ構造を直接利用できるという特徴がある。
Stats
|V(G)| = n
χf(G) は グラフGの分数彩色数
Λ(G) はグラフGのフォレスト複雑度
Quotes
"伝統的な統計的学習理論は、データが独立同一分布に従うという仮定に依存している。しかし、この仮定は多くの実世界のアプリケーションでは成り立たない。"
"本稿では、データ間の依存関係がグラフで表現される学習問題を扱う。"