이 연구는 심층 시계열 예측 모델의 암묵적 추론 능력을 평가하기 위해 다음과 같은 실험을 수행했다:
구성(Composition) 과제: 모델이 훈련 데이터에서 관찰되지 않은 복합 시계열을 정확하게 예측할 수 있는지 평가한다. 이를 위해 선형, MLP 기반, 패치 기반 Transformer 모델의 가산, 감산, 곱셈, 함수 합성 능력을 테스트했다.
비교(Comparison) 과제: 모델이 훈련 데이터에서 관찰되지 않은 더 크거나 작은 값을 가진 시계열을 정확하게 예측할 수 있는지 평가한다.
역탐색(Inverse Search) 과제: 모델이 복합 시계열을 구성 요소로 분해할 수 있는지 평가한다.
실험 결과, 선형, MLP 기반, 패치 기반 Transformer 모델이 이러한 OOD 시나리오에서 강력한 성능을 보여, 단순한 패턴 기억을 넘어선 추론 능력을 가지고 있음을 시사한다. 특히 PatchTST 모델이 구성 과제에서 우수한 성능을 보였고, NHITS 모델이 전반적으로 강건한 성과를 나타냈다. 이는 향후 시계열 예측 모델 개발에 있어 패칭 및 계층적 아키텍처의 중요성을 보여준다.
翻譯成其他語言
從原文內容
arxiv.org
深入探究