이 연구는 대형 언어 모델(LLM)의 온도 매개변수가 창의성에 미치는 영향을 조사했다. 연구진은 LLAMA 2-CHAT 70B 모델을 사용하여 고정된 맥락(프롬프트 및 모델)에서 다양한 온도 값으로 이야기를 생성했다.
계산 분석에서는 온도가 증가할수록 출력의 다양성이 약간 증가하지만, 전반적으로 모델의 확률 분포 전체를 탐색하지는 못하는 것으로 나타났다. 인간 평가 실험에서는 온도와 창의성의 4가지 필수 조건(독창성, 전형성, 응집성, 일관성) 간의 상관관계를 분석했다. 그 결과 온도와 독창성 간에 약한 양의 상관관계, 온도와 일관성 간에 중간 수준의 부적 상관관계가 관찰되었다.
전반적으로 온도 매개변수가 창의성에 미치는 영향은 제한적이며, "창의성 매개변수"라는 주장보다는 더 복잡하다. 연구진은 LLM의 창의성을 향상시키기 위해 창의성 벤치마크 개발, 특수 목적의 디코딩 전략 설계, 프롬프트 설계를 통한 암묵적 정보 활용 등의 방향을 제안했다.
다른 언어로
소스 콘텐츠 기반
arxiv.org
더 깊은 질문