Core Concepts
대규모 언어 모델이 수학 문제 해결 시 관련 없는 조건을 식별하고 무시할 수 있도록 하는 새로운 접근법을 제안한다.
Abstract
이 논문은 대규모 언어 모델(LLM)이 수학 문제 해결 시 관련 없는 조건에 의해 혼란을 겪는 문제를 해결하기 위한 새로운 접근법을 제안한다.
관련 없는 조건 후보를 식별하기 위해 문제 조건과 질문 간의 의미적 관련성을 측정한다.
LLM을 사용하여 관련 없는 조건 후보가 실제로 관련 없는지 확인한다.
확인 결과를 바탕으로 LLM에게 관련 없는 조건을 무시하도록 지시하는 I3C 지침을 생성한다.
I3C 지침을 기존 CoT 프롬프팅 방법에 추가하여 LLM의 혼란을 줄이고 추론 경로를 개선한다.
가장 혼란스러운 문제와 그에 대한 추론 경로를 자동으로 선별하여 데모로 사용하는 I3C-Select 방법을 제안한다.
실험 결과, I3C와 I3C-Select는 다양한 수학 문제 데이터셋에서 기존 방법들을 크게 능가하는 성능을 보였다.
Stats
Steve는 5'6"이다.
Steve는 6인치 자랐다.
Mary의 키는 5피트이다.
질문: Steve의 키는 몇 인치인가?
Quotes
"Feel free to ignore irrelevant conditions in the problem description."