Core Concepts
時系列データの集合を用いて予測モデルを構築する際、特定の時系列に関する情報が過小評価されることがある。本研究では、この問題を不均衡学習の観点から捉え、過少表現の時系列に対して合成サンプルを生成することで、ローカルとグローバルのトレードオフを改善する手法を提案する。
Abstract
本研究では、時系列データの集合を用いて予測モデルを構築する際の課題に取り組む。一般的な手法では、グローバルモデルを用いて全ての時系列の情報を活用するか、ローカルモデルを用いて個別の時系列に特化したモデルを構築する。
しかし、グローバルモデルでは特定の時系列の特性を捉えきれない可能性があり、ローカルモデルでは学習に必要な十分なデータが得られない可能性がある。
そこで本研究では、時系列データの集合を不均衡学習の観点から捉え、過少表現の時系列に対して合成サンプルを生成することで、ローカルとグローバルのトレードオフを改善する手法を提案する。具体的には以下の通り:
時系列データの集合を正規化し、時間遅れ埋め込みによる教師あり学習用のデータセットを作成する。
注目する時系列を少数クラス、その他の時系列を多数クラスとみなし、オーバーサンプリング手法を用いて合成サンプルを生成する。
生成したサンプルを元のデータセットに追加し、予測モデルを構築する。
実験の結果、提案手法は既存の手法よりも注目する時系列の予測精度を向上させることができ、ローカルとグローバルのトレードオフを改善できることが示された。一方で、他の時系列の予測精度は低下する傾向にあるため、今後の課題として検討が必要である。
Stats
時系列データの集合には5502本の時系列が含まれている。