Core Concepts
제한된 데이터에서 고충실도 데이터와 저충실도 데이터를 활용하여 강건하고 정확한 기계 학습 모델을 학습하는 새로운 접근법을 제안한다.
Abstract
이 논문은 과학 및 공학 시스템에 대한 강건하고 정확하며 신뢰할 수 있는 기계 학습 대리 모델을 학습하는 새로운 다중 충실도 선형 회귀 접근법을 제안한다.
제안하는 접근법은 다양한 충실도와 비용의 데이터를 활용하여 선형 회귀 모델의 새로운 다중 충실도 몬테카를로 추정량을 정의한다.
이 추정량은 제한된 고충실도 데이터와 추가적인 저충실도 데이터를 결합하여 모델 분산을 크게 낮출 수 있다.
이론적 분석을 통해 제안 방법의 정확성과 제한된 학습 예산에 대한 강건성을 보장한다.
수치 실험 결과는 제안 방법이 동등한 비용의 고충실도 데이터만을 사용한 표준 모델에 비해 훨씬 낮은 예측 오차를 달성함을 보여준다.
Stats
고충실도 모델 f(1)(z) = 8 exp(z)
저충실도 모델 f(2)(z) = 0.9 * 8 exp(0.5z)
입력 변수 z는 U(0, 5) 분포를 따르며, 모델 f(1)과 f(2)의 비용은 각각 w1 = 1, w2 = 0.001
모델 f(1)과 f(2) 간 상관 계수는 ρ12 = 0.97