核心概念
분할 적합 예측이 배치 모드로 작동할 때 교환 가능한 데이터에 대해 미래 관측치의 유한 배치에 대한 경험적 적용범위의 정확한 분포와 배치 크기가 무한대로 갈 때의 정확한 분포를 결정한다. 두 분포 모두 명목 오적용 수준과 보정 샘플 크기에 의해서만 결정되는 보편적인 특성을 가진다.
摘要
이 논문은 분할 적합 예측 절차에 의해 생성된 예측 집합의 경험적 적용범위 분포에 대해 연구한다. 저자는 교환 가능한 데이터 시퀀스 가정 하에서 유한 미래 관측치 배치에 대한 경험적 적용범위의 정확한 분포와 배치 크기가 무한대로 갈 때의 정확한 분포를 도출한다.
주요 결과는 다음과 같다:
- 교환 가능한 데이터 시퀀스 가정 하에서 적합성 점수 시퀀스는 교환 가능하다.
- 경험적 적용범위 C(n,α)
m
은 베타-이항(⌈(1-α)(n+1)⌉, ⌊α(n+1)⌋) 분포를 따른다.
- 경험적 적용범위 C(n,α)
∞
는 베타(⌈(1-α)(n+1)⌉, ⌊α(n+1)⌋) 분포를 따른다.
이러한 결과는 적용 분야에서 보정 샘플 크기 선택을 위한 기준을 제공한다.
統計資料
1 - α ≤ P(Yn+i ∈ D(α)
n (Xn+i)) < 1 - α + 1/(n + 1)
경험적 적용범위 C(n,α)
m
의 기댓값은 P(Yn+1 ∈ D(α)
n (Xn+1))와 같다.