이 연구는 ChatGPT의 프롬프트 민감도를 분석하였다. 주요 내용은 다음과 같다:
온도 매개변수 T와 top-p 매개변수에 대한 민감도 분석을 수행하였다. 보수적인 생성(낮은 T, 낮은 top-p)이 더 나은 성능을 보였다.
다양한 프롬프트 템플릿을 평가하였다. 전문가 정체성을 명시하거나 단순한 프롬프트가 가장 좋은 성능을 보였다. 단계적 사고(Chain-of-Thought) 프롬프트는 일부 문제에서 우수했지만, 응답 구문 분석이 어려웠다.
관련 없는 전문성 언급이나 잘못된 인센티브 제공은 성능을 크게 저하시켰다. 반면 출력 형식에 대한 자세한 지침은 구문 분석을 용이하게 하였다.
이 연구는 ChatGPT와 같은 언어 모델의 프롬프트 설계 중요성을 보여준다. 향후 연구에서는 다른 언어 모델과 다양한 과제에 대한 프롬프트 최적화 기법을 탐구할 예정이다.
다른 언어로
소스 콘텐츠 기반
arxiv.org
더 깊은 질문