Core Concepts
제한된 데이터에서 고충실도 데이터와 저충실도 데이터를 활용하여 강건하고 정확한 기계 학습 모델을 학습하는 새로운 접근법을 제안한다.
Abstract
이 논문은 과학 및 공학 시스템에 대한 강건하고 정확하며 신뢰할 수 있는 기계 학습 대리 모델을 학습하는 새로운 다중 충실도 선형 회귀 접근법을 제안한다.
- 제안하는 접근법은 다양한 충실도와 비용의 데이터를 활용하여 선형 회귀 모델의 새로운 다중 충실도 몬테카를로 추정량을 정의한다.
- 이 추정량은 제한된 고충실도 데이터와 추가적인 저충실도 데이터를 결합하여 모델 분산을 크게 낮출 수 있다.
- 이론적 분석을 통해 제안 방법의 정확성과 제한된 학습 예산에 대한 강건성을 보장한다.
- 수치 실험 결과는 제안 방법이 동등한 비용의 고충실도 데이터만을 사용한 표준 모델에 비해 훨씬 낮은 예측 오차를 달성함을 보여준다.
Stats
고충실도 모델 f(1)(z) = 8 exp(z)
저충실도 모델 f(2)(z) = 0.9 * 8 exp(0.5z)
입력 변수 z는 U(0, 5) 분포를 따르며, 모델 f(1)과 f(2)의 비용은 각각 w1 = 1, w2 = 0.001
모델 f(1)과 f(2) 간 상관 계수는 ρ12 = 0.97