מושגי ליבה
인간과 대규모 언어 모델의 창의적 과정에는 차이가 있으며, 이는 창의성 점수와 관련이 있다.
תקציר
이 연구는 인간과 대규모 언어 모델(LLM)의 창의적 과정을 비교하였다.
먼저 문장 임베딩과 계층적 클러스터링을 사용하여 반응 범주를 자동으로 식별하고 의미적 유사성을 계산하였다. 이를 통해 반응 시퀀스에서 점프 신호를 생성하였다.
인간 데이터 분석 결과, 창의적 사고 과제(AUT)에서는 지속적(특정 개념 공간에 깊이 탐색) 및 유연한(다양한 개념 공간에 걸쳐 탐색) 두 가지 경로가 관찰되었으며, 이 두 경로 모두 유사한 창의성 점수로 이어졌다.
반면 LLM은 과제에 따라 지속적 또는 유연한 경로로 편향되는 경향을 보였다. 또한 LLM의 경우 유연한 모델이 창의성 점수가 더 높았는데, 이는 인간과 다른 양상이다.
이 연구는 인간과 LLM의 창의적 과정을 자동화된 방법으로 비교하여 이해하는 데 기여하며, LLM을 인공 참여자 또는 공동 창작자로 활용하는 데 유용한 통찰을 제공한다.
סטטיסטיקה
인간 참여자 수: 220명
LLM 모델 수: 8개
LLM 반응 시퀀스 수: 440개
ציטוטים
"LLM은 과제에 따라 지속적 또는 유연한 경로로 편향되는 경향을 보였다."
"LLM의 경우 유연한 모델이 창의성 점수가 더 높았는데, 이는 인간과 다른 양상이다."