المفاهيم الأساسية
大規模言語モデル(LLMs)は動的グラフ上の時空間情報を理解し、処理する能力を持つ。
الملخص
この論文では、大規模言語モデル(LLMs)の時空間理解能力を評価するために、新しいLLM4DyGベンチマークが提案されました。このベンチマークには、時間と空間の両面から能力評価を考慮した9つの動的グラフタスクが含まれています。実験結果から、LLMsは動的グラフ上で時空間情報を理解する初期段階の能力を持ち、タスクによって難易度が異なることが示されました。さらに、特定のプロンプティング方法やLLMsのサイズによってパフォーマンスが変化することも明らかになりました。
الإحصائيات
LLMsはランダムな基準線よりもすべてのタスクで優れた性能を示す。
グラフサイズが増加すると、多くの動的グラフタスクがLLMsにとって難しくなる。
時間範囲ではなく密度が増加すると、ほとんどのタスクでモデルパフォーマンスが低下する。
اقتباسات
"In an era marked by the increasing adoption of Large Language Models (LLMs) for various tasks, there is a growing focus on exploring LLMs’ capabilities in handling web data, particularly graph data."
"Our main observations are: 1) LLMs have preliminary spatial-temporal understanding abilities on dynamic graphs, 2) Dynamic graph tasks show increasing difficulties for LLMs as the graph size and density increase, while not sensitive to the time span and data generation mechanism, 3) the proposed DST2 prompting method can help to improve LLMs’ spatial-temporal understanding abilities on dynamic graphs for most tasks."