核心概念
与えられた軌跡Tと距離∆に対して、複雑度が最大ℓの曲線のセットCを見つけ、Tをそれらの部分曲線で覆うことができる。Cの基準曲線は最小のカーディナリティを持つ。
要約
本論文では、軌跡Tと距離パラメータ∆、整数パラメータℓを入力として受け取り、(ℓ, ∆)-クラスタリングを構築するアルゴリズムを提案する。(ℓ, ∆)-クラスタリングとは、Tを複雑度が最大ℓの基準曲線で覆うことができ、各基準曲線とその対応する部分軌跡の間のFréchet距離が∆以下となるようなクラスタの集合である。
アルゴリズムの概要は以下の通り:
- Tの2∆-簡略化曲線Sを構築する。任意の(ℓ, ∆)-pathlet(P, I)に対して、Sの部分曲線S[a, d]が存在し、(S[a, d], I)は(ℓ+2-|N∩{a, d}|, 4∆)-pathletとなる。
- 貪欲アルゴリズムを用いて(ℓ, 4∆)-クラスタリングを構築する。各反復で、未カバーの領域を最大限カバーする(ℓ, 4∆)-pathletを選択し、クラスタリングに追加する。
- 基準曲線がS[a, d]の形をとる2種類のpathletを構築する:
- 頂点間pathlet: 基準曲線がSの頂点部分曲線
- 辺部分pathlet: 基準曲線がSの辺の部分線分
これらのpathletの中から、未カバー領域を最大限カバーするものを選択する。
提案アルゴリズムは、O(kn3 log4 n)の時間計算量とO(n log2 n + n · (k + ℓ) log n)の空間計算量で、サイズが51k ln(6n) + 1以下の(ℓ, 4∆)-クラスタリングを構築する。これは、既存研究と比べて、クラスタリングの質(∆の近似精度)と空間効率が大幅に向上している。
統計
Tの頂点数nは、クラスタリングのサイズkと複雑度ℓに依存する空間O(n log2 n + n · (k + ℓ) log n)を使用する。
提案アルゴリズムの時間計算量はO(kn3 log4 n)である。