이 논문은 언어 모델의 추론 능력을 향상시키기 위해 체인 사고(Chain-of-Thought)가 아닌 사고 그래프(Graph-of-Thought) 기반 접근법을 제안한다.
체인 사고는 인간의 사고 과정을 순차적인 체인으로 모델링하지만, 실제 인간의 사고는 비선형적이고 그래프 형태로 이루어진다.
사고 그래프는 사고 단위를 노드로, 사고 간 연결을 간선으로 표현하여 인간의 비순차적 사고 과정을 더 잘 포착한다.
사고 그래프 구축을 위해 Extract-Cluster-Coreference(ECC) 프로세스를 제안한다. 이를 통해 추론 과정의 논리적 구조를 모델링한다.
사고 그래프 표현을 언어 모델의 입력 특징으로 융합하는 게이트 융합 메커니즘을 사용한다.
실험 결과, 사고 그래프 기반 접근법이 체인 사고 기반 모델보다 AQUA-RAT와 ScienceQA 데이터셋에서 더 나은 성능을 보였다. 특히 복잡한 문제에서 큰 성능 향상을 보였다.
На другой язык
из исходного контента
arxiv.org
Дополнительные вопросы