Concepts de base
대규모 언어 모델이 수학 문제 해결 시 관련 없는 조건을 식별하고 무시할 수 있도록 하는 새로운 접근법을 제안한다.
Résumé
이 논문은 대규모 언어 모델(LLM)이 수학 문제 해결 시 관련 없는 조건에 의해 혼란을 겪는 문제를 해결하기 위한 새로운 접근법을 제안한다.
- 관련 없는 조건 후보를 식별하기 위해 문제 조건과 질문 간의 의미적 관련성을 측정한다.
- LLM을 사용하여 관련 없는 조건 후보가 실제로 관련 없는지 확인한다.
- 확인 결과를 바탕으로 LLM에게 관련 없는 조건을 무시하도록 지시하는 I3C 지침을 생성한다.
- I3C 지침을 기존 CoT 프롬프팅 방법에 추가하여 LLM의 혼란을 줄이고 추론 경로를 개선한다.
- 가장 혼란스러운 문제와 그에 대한 추론 경로를 자동으로 선별하여 데모로 사용하는 I3C-Select 방법을 제안한다.
실험 결과, I3C와 I3C-Select는 다양한 수학 문제 데이터셋에서 기존 방법들을 크게 능가하는 성능을 보였다.
Stats
Steve는 5'6"이다.
Steve는 6인치 자랐다.
Mary의 키는 5피트이다.
질문: Steve의 키는 몇 인치인가?
Citations
"Feel free to ignore irrelevant conditions in the problem description."