核心概念
本稿では、時系列データを画像に変換することで、短・長期時系列データの生成モデリングを拡散モデルを用いて効果的に行う手法を提案する。
書誌情報: Naiman, I., Berman, N., Pemper, I., Arbiv, I., Fadlon, G., & Azencot, O. (2024). Utilizing Image Transforms and Diffusion Models for Generative Modeling of Short and Long Time Series. Advances in Neural Information Processing Systems, 38.
研究目的: 本研究は、従来手法では困難であった、短・長期時系列データの両方に対応可能な統一的な生成モデルの開発を目的とする。
方法: 本研究では、時系列データを画像に変換し、画像生成に優れた拡散モデルを用いることで、時系列データの生成を行う。具体的には、遅延埋め込みと短時間フーリエ変換を用いて時系列データを画像に変換し、拡散モデルの一種であるEDMを用いて画像生成を行う。
主な結果: 提案手法は、短・長期時系列データの標準的なベンチマークデータセットを用いた実験において、従来手法を上回る性能を示した。特に、長期時系列データセットであるFRED-MD、NN5 Daily、Temperature Rainにおいて、従来手法であるLS4を上回る性能を示した。また、本研究では、10,000ステップを超える超長期時系列データセットとして、San Francisco TrafficとKDD-Cup 2018を用いた実験を行い、提案手法が超長期時系列データに対しても有効であることを示した。さらに、提案手法は、時系列データの補間や外挿などの条件付き生成タスクにおいても、従来手法を上回る性能を示した。
結論: 本研究で提案した、時系列データを画像に変換し拡散モデルを用いる手法は、短・長期時系列データの生成モデリングにおいて有効であることが示された。
意義: 本研究は、時系列データの生成モデリングにおける新たな可能性を示唆するものであり、今後、様々な分野への応用が期待される。
限界と今後の研究: 本稿では、遅延埋め込みと短時間フーリエ変換の2種類の画像変換手法を用いたが、他の変換手法を用いた場合の性能評価は今後の課題である。また、提案手法は、従来手法よりも計算コストが大きいため、計算コストの削減も今後の課題である。
統計
短期時系列データセットにおける識別スコアにおいて、提案手法は従来の拡散モデルと比較して平均58.17%の改善を示した。
長期時系列データセットにおける分類スコアにおいて、提案手法は従来の拡散モデルと比較して平均132.61%の改善を示した。
提案手法は、256×256サイズの画像を用いることで、最大65,000ステップの長期時系列データを扱うことができる。