이 논문은 시계열 예측 모델의 성능 향상을 위한 새로운 데이터 증강 방법인 AutoTSAug를 소개한다.
먼저, 저자들은 여러 개의 사전 학습된 예측 모델로 구성된 모델 동물원을 활용하여 훈련 데이터 중 예측 오차의 분산이 높은 "한계 샘플"을 식별한다. 이는 이러한 샘플들이 모델 학습에 중요한 역할을 하지만 기존 모델들이 일관되게 잘 학습하지 못하는 것을 의미한다.
다음으로, 저자들은 변분 마스크드 오토인코더(V-MAE)를 기반으로 한 신경망 증강기를 제안한다. 이 증강기는 REINFORCE 알고리즘을 통해 모델 동물원의 예측 오차 분산을 최소화하는 방향으로 한계 샘플을 변환한다. 이를 통해 증강된 데이터는 원본 데이터의 분포를 유지하면서도 모델 학습에 도움이 되는 패턴을 포함하게 된다.
실험 결과, AutoTSAug는 다양한 시계열 데이터셋에서 기존 데이터 증강 방법들보다 우수한 성능을 보였다. 또한 모델 동물원의 일부 모델이 성능이 좋지 않더라도 AutoTSAug가 효과적으로 작동하는 것으로 나타났다. 이는 AutoTSAug가 시계열 예측 모델의 성능 향상에 효과적인 데이터 증강 기법임을 보여준다.
Naar een andere taal
vanuit de broninhoud
arxiv.org
Belangrijkste Inzichten Gedestilleerd Uit
by Haochen Yuan... om arxiv.org 09-11-2024
https://arxiv.org/pdf/2409.06282.pdfDiepere vragen