Core Concepts
GTXは、高スループットのトランザクション処理と競争力のあるグラフ分析を両立する、ラッチフリーの書き込み最適化されたトランザクショナルグラフデータシステムである。
Abstract
GTXは、以下の特徴を持つトランザクショナルグラフデータシステムである:
ラッチフリーのグラフストレージを使用し、アトミック操作を利用してバーテックスとエッジを更新する。これによりラッチのオーバーヘッドを排除し、スレッドの待機時間を削減する。
デルタチェーンベースのデルタストレージと線形デルタストレージを組み合わせ、デルタチェーンの効率的なルックアップと線形ストレージのキャッシュパフォーマンスの両方の利点を活かす。
デルタチェーンレベルでのコンカレンシーコントロールを採用し、ワークロードの履歴に応じて適応的にコンカレンシーを管理する効率的なトランザクション管理とコンカレンシーコントロールプロトコルを持つ。
ハイブリッドなグループコミットプロトコルを持ち、トランザクションのコミットスループットを向上させる。
GTXは、実世界のパワーロー特性を持つグラフに対して、時間的局所性とホットスポットを持つ更新パターンにも適応できる唯一のシステムである。GTXは、グラフライブラリとしてプロトタイプ化され、実際のデータセットと合成データセットを使ってGFEツールで評価されている。
Stats
yahoo-songs グラフには1,625,951個のバーテックスと256,804,235個のエッジが含まれる
edit-wiki グラフには50,757,442個のバーテックスと572,591,272個のエッジが含まれる
graph500-24 合成グラフには8,870,942個のバーテックスと260,379,520個のエッジが含まれる