이 논문은 대규모 언어 모델(LLM)이 수학 문제 해결 시 관련 없는 조건으로 인해 혼란을 겪는 문제를 해결하기 위한 새로운 접근법을 제안한다.
먼저 문제 설명에서 관련 없는 조건 후보들을 식별한다. 이를 위해 각 조건과 문제 질문 간의 의미적 관련성을 측정한다. 그 다음 LLM을 활용하여 이 후보들이 실제로 관련 없는지 확인한다. 마지막으로 이 확인 결과를 바탕으로 LLM에게 관련 없는 조건을 무시하도록 지시하는 I3C 지침을 생성한다. I3C 지침은 기존의 Chain-of-Thought(CoT) 프롬프팅 방법에 추가될 수 있다.
또한 I3C-Select 방법을 제안한다. 이는 가장 혼란스러운 문제와 그에 대한 추론 경로를 자동으로 선별하여 시범 사례로 활용함으로써 소수 샷 학습을 향상시킨다.
실험 결과, I3C와 I3C-Select를 적용하면 다양한 수학 문제 데이터셋에서 기존 방법들을 크게 능가하는 성능을 보인다. 특히 관련 없는 조건이 포함된 문제에서 두드러진 성능 향상을 확인할 수 있다.
In eine andere Sprache
aus dem Quellinhalt
arxiv.org
Wichtige Erkenntnisse aus
by Zhenyu Wu,Ch... um arxiv.org 03-20-2024
https://arxiv.org/pdf/2403.12744.pdfTiefere Fragen