이 연구는 대규모 언어 모델의 성격 특성을 체계적으로 분석하여 심리학적 척도의 신뢰성을 평가했다. 5가지 요인(지시문, 문항, 언어, 선택지 레이블, 선택지 순서)을 다양하게 변화시켜 2,500개의 데이터 포인트를 생성했다. 분석 결과, GPT-3.5-Turbo를 비롯한 여러 모델이 Big Five Inventory에서 일관된 성격 특성을 보여주었다. 이는 이러한 심리학적 척도가 대규모 언어 모델에 신뢰성 있게 적용될 수 있음을 시사한다.
또한 이 연구는 GPT-3.5-Turbo가 특정 지시문에 따라 다양한 성격을 표현할 수 있음을 보여주었다. 환경 조성, 성격 할당, 캐릭터 구현 등의 방법을 통해 모델의 성격 분포를 조절할 수 있었다. 이는 대규모 언어 모델이 사회과학 연구에서 인간 참여자를 대체할 수 있는 잠재력을 지님을 시사한다.
A otro idioma
del contenido fuente
arxiv.org
Ideas clave extraídas de
by Jen-tse Huan... a las arxiv.org 09-23-2024
https://arxiv.org/pdf/2305.19926.pdfConsultas más profundas