Główne pojęcia
本研究では、Tor利用者の実際の行動を反映した、ウェブサイトフィンガープリンティング攻撃のための最初の本物のTorトレースデータセットであるGTT23を提供する。GTT23は、これまでの合成データセットよりも現実的であり、ウェブサイトフィンガープリンティング攻撃と防御策の評価に役立つ。
Streszczenie
本研究では、Tor ネットワークの大規模な測定を行い、13,900,621件のTorトレースからなるGTT23データセットを作成しました。GTT23は、Tor利用者の実際の行動を反映しており、以下の特徴があります:
- 96%のトレースがポート80、8080、443を使用しており、ウェブトラフィックが主体です。
- 大半のトレースは短く、25セル(10.5 KB)以下です。一方で、ウェブページ全体の転送サイズは通常450 KB以上です。
- ドメインごとのトレース数は、一部の人気ドメインが多く、長い裾野がある、実際のTor利用者の行動を反映したパターンを示しています。
- トレースの長さにも大きなばらつきがあり、多くのTorトレースが完全に失敗するか、途中で終了していることが示唆されます。
これに対し、これまでの合成データセットは、ウェブトラフィックのみを対象とし、単純なユーザーモデルと静的なソフトウェアツールを使用して収集されており、人気ウェブサイトのインデックスページに焦点を当てていました。そのため、現実のTor利用者の行動を適切に反映できていませんでした。
GTT23は、Tor利用者の実際の行動を反映した最初の本物のデータセットであり、ウェブサイトフィンガープリンティング攻撃と防御策の評価に役立つと考えられます。
Statystyki
96%のトレースがポート80、8080、443を使用している
大半のトレースは25セル(10.5 KB)以下
80%以上のドメインについて、1つのトレースしか観測されていない