이 연구는 ChatGPT의 프롬프트 민감성을 평가하는 방법을 소개하였다. 감성 분석, 유해성 탐지, 풍자 탐지 등 3가지 감성 컴퓨팅 문제에 대해 실험을 진행하였다.
먼저 온도 매개변수 T와 top-p 매개변수의 민감도 분석을 수행하였다. 결과적으로 보수적인 생성(낮은 T, 낮은 top-p)이 더 나은 성능을 보였다.
다음으로 다양한 프롬프트 템플릿을 평가하였다. 전문가 정체성을 명시하거나 단순한 프롬프트가 대체로 우수한 성능을 보였다. 반면 단계적 사고(Chain-of-Thought) 프롬프트는 문제에 따라 성능이 크게 달랐고, 응답 구문 분석이 어려웠다. 특정 프롬프트에서는 작은 변화에도 성능이 크게 달라지는 민감도가 관찰되었다.
이 연구 결과는 언어 모델의 프롬프트 설계와 생성 매개변수 조정의 중요성을 보여준다. 향후 연구에서는 다른 언어 모델과 다양한 과제에 대한 분석이 필요할 것이다.
A otro idioma
del contenido fuente
arxiv.org
Consultas más profundas