核心概念
本論文は、差分プライバシーの枠組みの下で、接頭辞木とマルコフ過程を組み合わせることで、元のデータの特性を保ちつつ個人のプライバシーを保護する軌跡合成手法を提案する。
要約
本論文は、GPS搭載デバイスの普及により大量の軌跡データが生成されるようになった中で、これらのデータを活用しつつ個人のプライバシーを保護する手法を提案している。
具体的には以下の手順で軌跡合成を行う:
- 空間を離散化し、軌跡データをアンカーポイントの系列に変換する。
- アンカーポイントの系列を表現するために、接頭辞木とm次マルコフ過程を組み合わせたモデルを構築する。
- 差分プライバシーの枠組みに基づき、接頭辞木とマルコフ過程にそれぞれ適切なノイズを加える。
- ノイズ付きのモデルから新しい軌跡を合成する。
この手法により、元の軌跡データの特性を良好に保ちつつ、個人のプライバシーを保護することができる。実験結果から、提案手法が既存手法に比べて優れたデータ有用性を示すことが確認された。
統計
軌跡データの離散化により、各アンカーポイントから最大8つの隣接アンカーポイントへの遷移が可能となる。
接頭辞木の各ノードの軌跡数に対してラプラス雑音を加える際の感度は1である。
マルコフ過程の遷移確率を計算する際のクエリの感度は、軌跡データの1レコードの変更によって最大1変化する。
引用
"GPS搭載デバイスの普及と無線通信の発展により、個人の移動軌跡データが大量に生成されるようになった。これらのデータは、交通流解析、都市計画、マーケティング分析、伝染病モデリングなど、様々なデータマイニングやモデリングの応用に役立つ。一方で、これらの軌跡データには個人のプライバシーに関する情報が含まれており、適切に公開されないと個人のプライバシーが侵害される可能性がある。"
"差分プライバシーは、個人の参加/不参加に依存しない強力な保証を提供する。しかし、軌跡データの系列性と高次元性のため、差分プライバシーを満たしつつ元のデータの特性を保つことは依然として課題である。"