Core Concepts
大規模グラフでのGNNトレーニングを効率的に行うためのGPUイニシエイト直接ストレージアクセスを使用したGIDSデータローダーの導入
Abstract
Graph Neural Networks(GNNs)は、グラフ構造データから学習し、複雑な推論タスクを実行するための強力なツールとして注目されています。しかし、大規模グラフでのトレーニングは効率的なストレージアクセス方法が不足しているため課題です。既存のフレームワークではCPUがグラフサンプリングと特徴集約を担当し、GPUがモデル重みのトレーニングと更新を行っています。しかし、CPUはGPUに追いつくほどのサンプリングおよび特徴集約スループットを達成できません。この問題に対処するために、GPUイニシエイト直接ストレージアクセス(GIDS)データローダーが提案されました。このデータローダーは、GPU指向のGNNトレーニングを可能にし、全体的なDGL GNNトレーニングパイプラインを最大582倍加速します。
Stats
GIDSデータローダーはDGL GNNトレーニングパイプライン全体を最大582倍加速します。
Quotes
"Our evaluation using a single GPU on terabyte-scale GNN datasets shows that the GIDS dataloader accelerates the overall DGL GNN training pipeline by up to 582× when compared to the current, state-of-the-art DGL dataloader."