Core Concepts
高次元時系列データの可視化において、時間的な関係性を考慮することで、より意味のある2次元埋め込みを得ることができる。
Abstract
本研究では、高次元時系列データの可視化のために、方向性を考慮したt-SNEアプローチを提案している。
具体的には、以下の2つの損失関数を導入している:
方向一貫性損失(Directional Coherence Loss: DCL)
近接する矢印が同じ方向を向くように誘導する
矢印長さ損失(Edge Length Loss: ELL)
長い矢印を短くするように誘導する
これらの損失関数を組み合わせて、t-SNEアルゴリズムに組み込むことで、時間的な関係性を明示的に考慮した2次元埋め込みを得ることができる。
提案手法を合成データと2つの実データセット(COVID-19パンデミックの推移、単語の意味変化)に適用し、従来のt-SNEと比較して、時間的な変化を明確に捉えられることを示している。
また、DCLとELLのパラメータ設定が可視化結果に与える影響についても分析している。
Stats
COVID-19パンデミックのデータでは以下のような重要な数値が抽出された:
1日あたりの検査数
1日あたりの確認症例数
1日あたりの入院患者数
単語の意味変化のデータでは、特定の単語(gay)の意味変化の過程が示されている。