Core Concepts
ランダムプロジェクションを使ったグラフ埋め込みでは、ノードの次数が低い/高い場合に内積の近似が特に不正確になる。一方、コサイン類似度の近似は次数に依存せずに良好に保たれる。
Abstract
本論文は、ランダムプロジェクションを使ったグラフ埋め込みの性質を理論的に分析したものである。
主な内容は以下の通り:
ランダムプロジェクションを使った際の、ノード間の内積、コサイン類似度の近似特性を解析した。
内積の近似では、ノードの次数が低い/高い場合に大きな誤差が生じることを示した。
コサイン類似度の近似では、次数に依存せずに良好な近似が得られることを示した。
上記の結果を踏まえ、ランダムプロジェクションを使ったグラフ埋め込みの際は、コサイン類似度を使うことを提案した。
理論的な分析に加え、実際のWikipediaデータを用いた実験も行い、提案手法の有効性を確認している。
Stats
ノードuの次数をduとすると、次が成り立つ:
du ≤ nuu ≤ d2
u
nuv / dudv = TuTv