Core Concepts
앙상블 학습 기법을 활용하여 위성 강수 데이터와 지상 관측 데이터를 통합하여 공간 보간 시 발생하는 불확실성을 효과적으로 추정할 수 있다.
Abstract
이 연구는 위성 강수 데이터와 지상 관측 강수 데이터를 통합하여 공간 보간을 수행할 때 발생하는 불확실성을 효과적으로 추정하기 위한 방법을 제안한다.
주요 내용은 다음과 같다:
6개의 개별 알고리즘(QR, QRF, GRF, GBM, LightGBM, QRNN)을 기반으로 6개의 스태킹 앙상블 학습 방법과 3개의 단순 앙상블 학습 방법을 제안하였다.
이 앙상블 학습 방법들을 미국 본토(CONUS) 지역의 15년간 월별 강수 데이터에 적용하여 성능을 평가하였다.
스태킹 방법 중 QR과 QRNN을 조합한 방법이 가장 우수한 성능을 보였으며, 기준 방법(QR)대비 3.91%에서 8.95%의 성능 향상을 달성하였다.
개별 알고리즘 중에서는 LightGBM이 가장 우수한 성능을 보였다.
앙상블 학습 방법이 개별 알고리즘에 비해 특히 높은 분위수 수준에서 더 나은 성능을 보였다.
특징 엔지니어링 측면에서 거리 가중 위성 강수 데이터를 사용하여 예측 변수 수를 절반으로 줄였다.
이 연구는 위성 강수 데이터와 지상 관측 데이터를 통합하는 문제에서 앙상블 학습의 잠재력을 보여주며, 공간 보간 시 발생하는 불확실성을 효과적으로 추정할 수 있는 새로운 방법론을 제시한다.
Stats
거리 가중 IMERG 변수 1-4는 다른 변수들에 비해 상대적으로 중요한 예측 변수이다.
지상 관측소의 고도는 0.300 이상의 분위수 수준에서 중요한 예측 변수로 나타났다.
Quotes
"Predictive uncertainty estimation is essential because of the large amount of information that it provides to decision makers."
"Ensemble learning can be made either in simple (equal weight averaging, e.g., Petropoulos and Svetunkov 2020) or complex (e.g., Wolpert 1992) ways."
"Stacking with QR and QRNN yielded the best results across quantile levels of interest (0.025, 0.050, 0.075, 0.100, 0.200, 0.300, 0.400, 0.500, 0.600, 0.700, 0.800, 0.900, 0.925, 0.950, 0.975), surpassing the reference method by 3.91% to 8.95%."