Core Concepts
실시간 데이터 증강 기법인 OnDAT를 활용하면 기존 데이터 증강 방식보다 시계열 예측 성능을 향상시킬 수 있다.
Abstract
이 논문은 시계열 예측 문제에서 딥러닝 모델의 성능을 향상시키기 위한 실시간 데이터 증강 기법인 OnDAT를 제안한다. 기존의 데이터 증강 방식은 모델 학습 전에 한 번만 데이터를 증강하지만, OnDAT는 모델 학습 과정 중에 실시간으로 데이터를 증강한다.
OnDAT는 계절 분해와 이동 블록 부트스트래핑 기법을 활용하여 새로운 합성 시계열 데이터를 생성한다. 이를 통해 모델이 다양한 데이터 변형에 노출되어 과적합을 방지하고 예측 성능을 향상시킬 수 있다.
실험 결과, OnDAT는 기존 데이터 증강 방식이나 데이터 증강을 사용하지 않는 방식보다 우수한 예측 성능을 보였다. 또한 OnDAT는 검증 데이터에도 데이터 증강을 적용하여 조기 중단 및 모델 체크포인팅 메커니즘을 개선할 수 있었다. 다만 OnDAT는 다른 방식에 비해 학습 시간이 다소 더 오래 걸리는 단점이 있다.
Stats
시계열 데이터의 평균값은 72.7입니다.
총 75,797개의 시계열 데이터가 있으며, 전체 관측치 수는 14,062,121개입니다.
Quotes
"실시간 데이터 증강을 통해 모델이 다양한 데이터 변형에 노출되어 과적합을 방지하고 예측 성능을 향상시킬 수 있습니다."
"OnDAT는 검증 데이터에도 데이터 증강을 적용하여 조기 중단 및 모델 체크포인팅 메커니즘을 개선할 수 있었습니다."