本論文は、時系列データ理解における大規模言語モデル(LLM)の能力を包括的に評価するフレームワークを提案している。
まず、時系列データの特徴を体系的に分類した分類法を導入した。この分類法は単変量および多変量の時系列データの特徴を網羅しており、LLMの時系列データ理解能力を評価する上で重要な基盤となる。
次に、この分類法に基づいて合成された多様な時系列データセットを用いて、LLMの性能を評価した。具体的には、時系列特徴の検出と分類、データ検索、算術推論の4つのタスクを設定し、GPT4、GPT3.5、Llama2、Vicunaの4つのLLMを評価した。
評価の結果、LLMは時系列データの傾向や季節性の検出・分類では高い性能を示したが、構造的変化や異常値の検出・分類では課題があることが明らかになった。また、データ形式、時系列長、データ位置バイアスなどの要因がLLMの性能に大きな影響を及ぼすことも示された。
本研究は、LLMの時系列データ理解能力の現状を包括的に明らかにし、実用化に向けた課題を提示するものである。今後の研究では、マルチモーダルデータの統合や解釈可能性の向上など、LLMの時系列分析能力をさらに高めるための取り組みが期待される。
Na inny język
z treści źródłowej
arxiv.org
Głębsze pytania