Core Concepts
그래프 의존성 하에서 Rademacher 복잡도와 알고리즘 안정성을 이용하여 일반화 경계를 도출한다.
Abstract
이 논문은 전통적인 통계적 학습 이론이 가정하는 독립 동일 분포(i.i.d.) 가정이 성립하지 않는 상황에서의 일반화 경계를 다룬다.
데이터 간 의존성을 그래프로 모델링하고, 이를 활용하여 Rademacher 복잡도와 알고리즘 안정성 기반의 일반화 경계를 도출한다.
그래프 의존성에 대한 다양한 농도 불평등을 소개하고, 이를 통해 Rademacher 복잡도와 알고리즘 안정성 기반의 일반화 경계를 유도한다.
실제 학습 과제(순위 학습, 다중 분류 등)에 이 프레임워크를 적용하여 일반화 경계를 도출한다.
향후 연구 방향으로 그래프 의존성 하에서의 다른 일반화 이론 개발을 제시한다.
Stats
그래프 G의 분할 색인 수 χf(G)는 일반화 경계의 핵심 요소이다.
그래프 G의 최대 차수 Δ(G)는 χf(G)의 상한이 된다.
그래프 G가 트리일 경우, Λ(G) = O(n)이며 이는 Janson의 농도 불평등과 유사한 수준이다.
그래프 G가 격자일 경우, Λ(G) = O(n^(3/2))이다.
Quotes
"전통적인 통계적 학습 이론은 관찰치가 고정되지만 알려지지 않은 확률 분포에 대해 독립적이고 동일하게 분포된다고 가정한다."
"그러나 많은 실제 응용 분야에서 수집된 데이터는 의존적이므로 i.i.d. 가정이 성립하지 않는다."