Core Concepts
시계열 데이터 집합에서 특정 시계열에 대한 대표성을 높이기 위해 과대표집 기법을 활용하는 방법을 제안한다.
Abstract
이 연구는 다수의 단변량 시계열로 구성된 데이터 집합에서 특정 시계열에 대한 예측 성능을 향상시키는 방법을 제안한다.
데이터 준비 단계에서는 시계열 데이터를 평균 정규화하고 시간 지연 임베딩을 적용하여 지도 학습 형태로 변환한다.
이후 특정 시계열에 대한 대표성을 높이기 위해 과대표집 기법을 활용한다. 이를 통해 특정 시계열에 대한 예측 성능을 향상시키면서도 전체 데이터 집합에 대한 예측 성능도 유지할 수 있다.
실험 결과, 제안한 방법인 TSER이 기존의 전역 모델과 지역 모델에 비해 특정 시계열에 대한 예측 성능이 우수한 것으로 나타났다. 또한 데이터 통합 방식과 합성 샘플 생성 비율에 따른 민감도 분석을 수행하여 최적의 설정을 확인하였다.
Stats
특정 시계열에 대한 관측치는 전체 데이터 집합의 일부분에 불과하다.
전체 데이터 집합에는 5,502개의 단변량 시계열이 포함되어 있다.
Quotes
"최근 최첨단 예측 방법은 여러 시계열 집합을 기반으로 학습된다. 이러한 방법, 즉 전역 모델은 다양한 시계열에서 공통적인 패턴을 포착하여 일반화 성능을 향상시킬 수 있다. 그러나 이를 위해서는 충분한 양의 데이터가 필요하다."
"이 연구의 주요 기여는 단변량 시계열 합성 샘플을 생성하는 새로운 방법을 제안하는 것이다."