이 연구는 사전 훈련된 언어 모델(PLM)에서 관련 잠재 구성 요소를 평가하고 조작하는 방법론을 제시한다.
주요 내용은 다음과 같다:
심리측정 설문지를 자연어 추론(NLI) 프롬프트로 변환하는 방법을 제안했다. 이를 통해 대화형 모델뿐만 아니라 비대화형 모델에서도 잠재 구성 요소를 평가할 수 있다.
88개의 공개 PLM을 대상으로 불안, 우울, 통일성 감각과 같은 정신 건강 관련 잠재 구성 요소를 평가했다. 이 결과는 인간 심리학의 표준 이론과 일치한다.
통일성 감각을 강화하는 방식으로 PLM을 조정하면 불안과 우울 증상을 완화할 수 있음을 보였다. 이는 PLM의 성능을 해석하고 조정하여 더 설명 가능하고 신뢰할 수 있는 모델을 개발할 수 있음을 시사한다.
Na inny język
z treści źródłowej
arxiv.org
Głębsze pytania