Core Concepts
대형 언어 모델은 구조화된 그래프 표현을 직접 처리하는 데 어려움을 겪으며, 이는 입력 표현의 단일 차원성으로 인한 것이다. 이 연구는 다양한 대형 언어 모델의 그래프 추론 능력을 체계적으로 평가하고, 이를 개선하기 위한 새로운 프롬프팅 기법을 제안한다.
Abstract
이 연구는 대형 언어 모델(LLM)의 그래프 추론 능력을 체계적으로 평가한다. 연구진은 10개의 다양한 그래프 탐색 문제를 설계하여 5개의 다른 LLM(GPT-4, GPT-3.5, Claude-2, Llama-2, Palm-2)을 벤치마크했다. 이를 통해 LLM의 그래프 추론 능력의 한계, 편향, 특성을 파악했다.
주요 발견:
LLM은 구조화된 그래프 표현을 직접 처리하는 데 어려움을 겪음
그래프의 평균 자유도가 높을수록 LLM의 추론 능력이 낮아짐
k-shot 프롬프팅은 그래프 추론 작업에 도움이 되지 않음
LLM은 유효한 솔루션이 없는 경우에도 긍정적인 응답을 하는 편향을 보임
이를 바탕으로 연구진은 새로운 프롬프팅 기법(PathCompare)을 제안했고, 이를 통해 LLM의 그래프 추론 성능이 향상되었다.
Stats
그래프의 평균 자유도가 높을수록 LLM의 추론 성능이 낮아진다.
k-shot 프롬프팅은 그래프 추론 작업에 도움이 되지 않는다.
LLM은 유효한 솔루션이 없는 경우에도 긍정적인 응답을 하는 편향을 보인다.
Quotes
"대형 언어 모델은 구조화된 그래프 표현을 직접 처리하는 데 어려움을 겪는다."
"그래프의 평균 자유도가 높을수록 LLM의 추론 능력이 낮아진다."
"k-shot 프롬프팅은 그래프 추론 작업에 도움이 되지 않는다."