本研究では、GALLa (Graph Aligned Large Language Models)と呼ばれる手法を提案している。GALLaは、大規模言語モデルにグラフニューラルネットワークを組み合わせることで、ソースコードの構造情報を取り入れる。具体的には以下の手順で行う:
この手法により、大規模言語モデルはソースコードの構造情報を活用しつつ、既存の高性能な言語モデルの能力を保持することができる。実験の結果、GALLaは4種類の大規模言語モデルに対して一貫して性能向上を示した。特に、小規模な言語モデルに対する効果が顕著であった。また、ソースコードの構造情報はプログラミング言語間の知識転移にも寄与することが示された。
A otro idioma
del contenido fuente
arxiv.org
Ideas clave extraídas de
by Ziyin Zhang,... a las arxiv.org 09-09-2024
https://arxiv.org/pdf/2409.04183.pdfConsultas más profundas