현재 시계열 이상 탐지 연구는 부적절한 평가 지표, 일관성 없는 벤치마킹 관행, 새로운 딥러닝 모델 설계에 대한 적절한 정당화 부족으로 인해 문제가 있다. 이 논문은 현 상황에 대한 비판적 분석을 제시하고, 모델 설계의 혁신성 추구에서 벗어나 벤치마킹 관행 개선, 비트리비얼 데이터셋 생성, 특정 과제에 대한 모델 아키텍처의 유용성 연구에 초점을 맞출 것을 주장한다.
본 논문에서는 기존의 Cauchy-Schwarz 발산을 확장하여 조건부 분포 간의 유사도를 정량화하는 조건부 Cauchy-Schwarz 발산을 제안하였다. 제안된 발산은 커널 밀도 추정기를 통해 간단히 추정될 수 있으며, 기존 방법들에 비해 계산 복잡도가 낮고 통계적 검정력이 높으며 다양한 응용에 활용될 수 있음을 보였다. 또한 시계열 데이터 클러스터링과 순차적 의사결정 문제에서 제안된 발산의 우수한 성능을 입증하였다.
AdaFSNet은 다양한 길이의 시계열 데이터에서 최적의 수용 영역 크기를 동적으로 선택하여 시계열 데이터 분류 정확도를 향상시킨다.
대규모 언어 모델(LLM)은 시계열 데이터 분석 및 보고에 자동화 잠재력을 제공하지만, 일반 목적 LLM의 고유한 능력을 체계적으로 평가하는 것이 중요하다.
시계열 데이터 시각화를 위한 일반적이고 효과적인 방법을 제시한다.
본 논문은 시계열 데이터에서 모티프를 효율적으로 탐지하는 새로운 기법인 k-Motiflets을 제안한다. k-Motiflets는 모티프 집합의 크기 k를 중심 매개변수로 사용하여, 모티프 집합의 유사도를 최대화한다. 이는 기존 방법들이 사용하는 거리 임계값 r보다 직관적이고 이해하기 쉬운 매개변수이다.
CGS-Mask는 시계열 데이터의 시간적 연속성을 고려하여 모델의 예측 결과를 직관적으로 설명할 수 있는 모델 독립적 사후 설명 방법이다.
TSLANet은 Fourier 분석과 적응형 필터링을 활용하여 시계열 데이터의 장단기 의존성을 효과적으로 학습하고 노이즈를 완화하는 혁신적인 합성곱 기반 모델이다.
시간 의존 예측변수를 포함하여 연속형, 범주형, 생존 결과를 예측하는 랜덤 포레스트 방법론을 제안하고 이를 구현한 DynForest R 패키지를 소개한다.
시계열 데이터의 통계적 특성을 활용하여 장기 시간 규모의 쌍대 상호작용을 탐지하고 해석할 수 있는 새로운 방법론을 제안한다.