Core Concepts
앙상블 모델의 성능은 사용되는 손실 함수가 볼록 함수일 때만 계속 향상된다. 볼록하지 않은 손실 함수의 경우, 좋은 모델로 구성된 앙상블은 계속 향상되지만 나쁜 모델로 구성된 앙상블은 계속 성능이 저하된다.
Abstract
이 논문은 앙상블 모델의 성능이 계속 향상되는지에 대한 이론적 분석을 제공한다.
먼저, 모든 구성 모델이 동등한 성능을 보이는 경우를 고려한다. 이 경우, 손실 함수가 볼록 함수라면 앙상블 모델의 평균 손실은 구성 모델 수가 증가함에 따라 감소한다. 반면 손실 함수가 비볼록 함수라면, 좋은 모델로 구성된 앙상블은 계속 향상되지만 나쁜 모델로 구성된 앙상블은 계속 성능이 저하된다.
이를 증명하기 위해 저자들은 꼬리 확률의 단조성에 관한 새로운 결과를 제시한다. 또한 의료 진단 문제와 영화 평점 예측 실험을 통해 이론적 결과를 뒷받침한다.
Stats
앙상블 크기 K가 증가할수록 전체 테스트 세트에 대한 정확도는 단조적 패턴이 없다.
앙상블의 최종 예측이 옳은 이미지들에 대한 정확도는 향상된다.
앙상블의 최종 예측이 틀린 이미지들에 대한 정확도는 저하된다.
Quotes
"앙상블 방법은 여러 기본 모델의 예측을 결합한다."
"우리는 더 많은 모델을 포함하는 것이 항상 평균 성능을 향상시키는지 여부를 연구한다."