Core Concepts
LLM은 사용자의 목표와 기본적 심리적 욕구를 인간 디자이너와 유사한 수준으로 추론할 수 있다.
Abstract
이 연구는 LLM(Large Language Model)을 활용하여 사용자의 정신 상태를 추론하고, 이를 인간 디자이너의 성과와 비교하였다.
사용자 참여자들은 최근 구매한 제품 또는 구매할 예정인 제품에 대한 경험이나 기대를 설명하는 댓글을 작성하고, 자신의 목표와 기본적 심리적 욕구(FPN)를 보고하였다.
디자이너 참여자들은 사용자 댓글을 읽고 사용자의 목표와 FPN을 추론하였다. 이와 함께 LLM 실험군들도 동일한 작업을 수행하였다.
분석 결과, GPT-4 모델은 인간 디자이너와 유사하거나 때로는 더 나은 성과를 보였다. GPT-3.5 모델은 목표 추론에서 잘 수행했지만 FPN 귀속에서는 어려움을 겪었다. 이는 LLM이 사용자의 정신 상태를 인간 수준으로 추론할 수 있음을 시사한다.
추가적으로 댓글 길이와 추론 성과 간 상관관계는 발견되지 않았다. 이는 추론에 필요한 정보가 주로 추론자의 기존 지식과 경험에서 비롯됨을 시사한다.
Stats
사용자 참여자 중 66.7%가 18~25세, 75.0%가 여성이었다.
디자이너 참여자 중 70.0%가 18~25세, 65.0%가 여성이었다.
디자이너 참여자의 60.0%가 사용자 연구 경험이 있었고, 30.0%가 많은 경험을 가지고 있었다.
Quotes
"LLM은 사용자의 목표와 기본적 심리적 욕구를 인간 디자이너와 유사한 수준으로 추론할 수 있다."
"추론에 필요한 정보는 주로 추론자의 기존 지식과 경험에서 비롯된다."