核心概念
대형 언어 모델(LLM)의 강력한 자기회귀 특성을 활용하여 그래프 구조 정보와 텍스트 속성을 융합함으로써, LLM을 그래프 이해 작업에 효과적으로 활용할 수 있다.
要約
이 논문은 대형 언어 모델(LLM)과 그래프 신경망(GNN)을 결합한 GraphPrompter 프레임워크를 제안한다. GraphPrompter는 두 가지 주요 구성 요소로 이루어져 있다:
- 그래프 정보를 인코딩하는 GNN
- 텍스트 정보를 효과적으로 처리하는 LLM
GNN은 그래프의 복잡한 구조 정보를 인코딩하여 노드 임베딩을 생성한다. 이 임베딩은 LLM에 대한 연성 프롬프트로 사용된다. LLM은 이 프롬프트와 텍스트 속성 정보를 결합하여 그래프 학습 작업을 수행한다.
실험 결과, 제안된 GraphPrompter 프레임워크는 노드 분류와 링크 예측 작업에서 다양한 벤치마크 데이터셋에 걸쳐 우수한 성능을 보였다. 이는 LLM이 연성 프롬프팅을 통해 그래프 학습 작업을 효과적으로 수행할 수 있음을 보여준다.
統計
그래프 신경망(GNN)을 이용하여 각 노드의 3홉 부그래프를 인코딩한 결과, 노드 임베딩 차원은 𝑑𝑔 = 128이다.
노드 임베딩을 LLM 차원인 𝑑𝑙 = 768로 맞추기 위해 MLP 프로젝션 레이어를 사용했다.
텍스트 속성(논문 제목 및 초록)은 LLM의 토크나이저를 통해 𝑀 = 512 길이의 토큰 시퀀스로 변환되었다.
引用
"GraphPrompter 프레임워크는 LLM의 강력한 자기회귀 특성을 활용하여 그래프 구조 정보와 텍스트 속성을 효과적으로 융합함으로써, LLM을 그래프 이해 작업에 활용할 수 있게 한다."
"실험 결과는 GraphPrompter가 다양한 벤치마크 데이터셋에서 노드 분류와 링크 예측 작업에서 우수한 성능을 보임을 입증한다."