핵심 개념
이 책은 형식적 예측의 이론적 기반, 특히 데이터 분포에 대한 가정 없이 예측 모델의 불확실성을 정량화하는 데 사용되는 순열 검정 및 교환성의 수학적 개념을 다룹니다.
초록
형식적 예측의 이론적 토대
이 문서는 Anastasios N. Angelopoulos, Rina Foygel Barber, Stephen Bates가 저술한 "형식적 예측의 이론적 토대"라는 책의 일부 발췌문입니다. 이 책은 형식적 예측 및 순열 검정과 교환성에 기반한 관련 추론 기술에 관한 내용을 다룹니다. 이러한 기술은 가설 검정 및 기계 학습 시스템에 대한 불확실성 정량화 보증 제공을 포함한 다양한 작업에 유용합니다.
독자에게 형식적 예측 및 분포-프리 추론과 관련된 질문을 연구할 때 발생하는 기본적인 기술적 논증에 대해 가르치는 것입니다. 이 책은 형식적 예측 분야의 이론적 기반에 대한 심층적인 이해를 제공하여 독자 스스로 형식적 예측 및 분포-프리 추론 내 다른 영역의 지속적인 이론적 개발에 기여할 수 있도록 하는 것을 목표로 합니다.
대상 독자
이 책은 광범위하게 말해서 통계 이론 및 방법론 개발에 종사하는 사람들을 위해 쓰여졌습니다. 고전적으로 훈련된 통계학자부터 끊임없이 변화하는 기계 학습 알고리즘 환경에 적용되는 모듈식 이론을 찾는 기계 학습 연구자까지 다양한 독자층을 대상으로 합니다. 필요한 배경 지식은 일반적으로 이론 통계학의 1학년 대학원 과정 수준입니다. 측도 이론이 가끔 사용되지만 이 책의 대부분 결과는 측도 이론을 필요로 하지 않습니다.
이 책의 구성
1부: 배경
교환성에 대한 수학적 관점에서의 소개와 이 책의 후반부에서 개발될 통계적 결과에 유용한 사실 및 속성에 대한 설명을 제공합니다. 형식적 예측은 순열 검정의 반전으로 재구성될 수 있기 때문에 순열 검정에 특히 주의를 기울입니다. 이러한 도구는 이 책의 나머지 부분에서 많은 증명과 직관에 매우 중요합니다.
2부: 형식적 예측
형식적 예측 프레임워크를 다룹니다. 특히, 이미 소개한 분할 형식적 예측 방법을 일반화한 전체 형식적 예측에 대해 논의하고, 기본적인 통계적 논리를 밝힙니다. 그런 다음 다양한 방법에 대한 긍정적인 결과와 더 많은 가정 없이 가능한 것의 한계를 보여주는 경도 결과를 혼합하여 주변 적용 범위보다 강력한 속성을 설명합니다.
3부: 형식적 예측의 확장
형식적 프레임워크 내에서 교차 검증 기반 방법, i.i.d. 설정을 벗어날 수 있는 형식적 예측의 가중치 버전, 스트리밍 데이터용으로 설계된 형식적 방법의 온라인 버전, 형식적 예측을 위한 계산적 지름길을 포함한 광범위한 다양한 확장에 중점을 둡니다. 또한 더 광범위한 위험 개념을 처리할 수 있는 형식적 예측의 변형, 선택적 추론, 다중 검정 및 모델 집합과의 연결과 같은 추가 주제도 간략하게 다룹니다. 이러한 주제는 이 분야의 최근 연구를 보여주는 샘플이며 지속적인 연구를 위한 많은 방향을 제시합니다.
4부: 예측 추론을 넘어서
예측 추론에 대한 초점에서 벗어나 회귀 함수 추정, 확률 추정 보정, 조건부 독립성 검정과 같은 다른 질문에 대한 분포-프리 추론 문제를 연구합니다. (본 문서에는 4부 내용이 포함되어 있지 않습니다.)
형식적 예측은 모든 분포에서 i.i.d.로 추출된 데이터에 대한 주변 적용 범위 속성을 보장합니다. 분포에 대한 조건(예: 평활도 또는 모수 모델)을 지정할 필요가 없습니다. 이 때문에 형식적 예측은 종종 분포-프리 추론 접근 방식으로 설명됩니다. 또한 데이터에 적착된 기본 모델에 조건을 지정할 필요가 없으며(예: ˆf가 Y와 X 사이의 실제 연관성에 대한 일관된 추정량이라고 가정), 결과는 점근적 보증만 제공하는 것이 아니라 모든 n 값에서 유지된다는 점에서 유한 표본입니다.