Core Concepts
개인의 구글 검색 기록을 활용하여 개방성 성격 특성을 예측할 수 있다.
Abstract
이 연구는 개인의 구글 검색 기록을 활용하여 개방성 성격 특성을 예측하는 것을 목표로 한다. 214명의 참여자로부터 평균 500만 단어 토큰의 개인 텍스트 코퍼스(ICs)를 수집하였다. 각 IC에 대해 word2vec 모델을 학습하고, 성격 특성을 정의하는 단어들과의 유사도를 계산하였다. 이를 바탕으로 신경망 모델을 학습하여 개방성 성격 특성을 예측하였다.
연구 결과, 선별된 신경망 모델은 테스트 집단에서 개방성 변량의 35%를 설명할 수 있었다. 앙상블 모델은 지적 관심사, 인문학 지식, 교육 수준 예측에서 더 안정적인 성과를 보였다. 또한 학습 곡선 분석을 통해 약 500명의 참여자가 필요할 것으로 추정되었다. 이 연구는 개인 텍스트 데이터가 설문 기반 심리진단을 보완하거나 대체할 수 있음을 시사한다.
Stats
개방성 성격 특성을 예측하는 신경망 모델은 테스트 집단에서 변량의 35%를 설명할 수 있었다.
앙상블 모델은 지적 관심사, 인문학 지식, 교육 수준 예측에서 더 안정적인 성과를 보였다.
약 500명의 참여자가 필요할 것으로 추정되었다.
Quotes
"you are what you read"
"the most important individual differences in human transactions will come to be encoded as single terms in (…) language(s)"