Konsep Inti
단계별 비교를 통해 언어 모델의 추론 성능을 향상시킬 수 있다.
Abstrak
이 논문은 언어 모델의 추론 능력 향상을 위한 새로운 프롬프팅 방법인 RankPrompt를 소개한다. RankPrompt는 언어 모델이 생성한 다양한 추론 경로를 체계적으로 비교하여 최적의 답변을 선택하는 방식이다.
주요 내용은 다음과 같다:
- 언어 모델은 추론 과정에서 논리적 오류를 범하는 경우가 많다. 기존 해결책인 태스크 특화 검증기 사용이나 다중 추론 경로 투표 방식은 많은 인간 주석이 필요하거나 일관성 없는 응답에 취약하다.
- RankPrompt는 언어 모델 자체의 능력을 활용하여 추가 자원 없이 응답을 순위화할 수 있다. 단계별 비교 지침과 비교 예시를 통해 언어 모델이 다양한 추론 경로를 체계적으로 비교할 수 있도록 한다.
- 11개 산술 및 상식 추론 과제에서 RankPrompt는 ChatGPT와 GPT-4의 성능을 최대 13% 향상시켰다. 또한 AlpacaEval 벤치마크에서 74%의 인간 선호도 일치율을 달성하며 오픈엔드 생성 평가에서도 우수한 성과를 보였다.
- RankPrompt는 응답 순서와 일관성 변화에도 강건한 것으로 나타났다.
Statistik
Bob은 총 $27,000을 3개 학교에 분배하여 책을 구매한다.
책 1권당 가격은 $500이다.
Kutipan
"LLMs often make logical mistakes during the reasoning process."
"RankPrompt breaks down the ranking problem into a series of comparisons among diverse responses, leveraging the inherent capabilities of LLMs to generate chains of comparison as contextual exemplars."