Core Concepts
LLM은 사용자의 목표와 기본적 심리적 욕구를 이해하는 데 있어 인간 디자이너와 유사한 수준의 성능을 보여줄 수 있다.
Abstract
이 연구는 LLM(Large Language Model)을 활용하여 사용자의 내적 정신 상태를 추론하는 방법을 제안하고 있다. 구체적으로 사용자 코멘트에서 사용자의 목표(do-goals, motor-goals, be-goals)와 기본적 심리적 욕구(FPNs)를 추론하는 실험을 수행했다.
실험에는 사용자 참여자 24명과 디자이너 참여자 20명이 참여했다. 사용자 참여자들은 자신의 제품 경험 및 기대에 대한 코멘트를 작성하고 자신의 목표와 FPNs를 보고했다. 디자이너 참여자들은 이 코멘트를 보고 사용자의 목표와 FPNs를 추론했다.
이와 병행하여 3가지 LLM 프롬프팅 기법(standard, chain-of-thoughts, tree-of-thoughts)을 적용하여 GPT-3.5와 GPT-4 모델의 정신 추론 성능을 평가했다.
분석 결과, GPT-4 모델은 인간 디자이너와 유사하거나 때로는 더 나은 수준의 정신 추론 성능을 보였다. GPT-3.5 모델도 목표 추론에서는 우수한 성과를 보였지만, FPNs 귀속에서는 어려움을 겪었다. 이는 LLM이 사용자의 내적 동기 상태를 이해하는 데 있어 인간 디자이너와 견줄만한 능력을 갖추고 있음을 시사한다.
이 연구 결과는 LLM 기반 인공 공감 시스템이 사용자 경험 연구 프로세스를 확장할 수 있는 가능성을 보여준다. 향후 연구에서는 정신 추론 범위를 더욱 확장하고 평가 방법을 개선하여 인공 공감 기술의 발전을 도모해야 할 것이다.
Stats
"LLM은 사용자의 목표를 추론하는 데 있어 인간 디자이너와 유사한 수준의 성능을 보였다."
"GPT-4 모델은 FPNs 귀속에서도 인간 디자이너와 유사한 수준의 성능을 보였다."
"GPT-3.5 모델은 목표 추론에서는 우수한 성과를 보였지만, FPNs 귀속에서는 어려움을 겪었다."
Quotes
"LLM은 사용자의 목표와 기본적 심리적 욕구를 이해하는 데 있어 인간 디자이너와 유사한 수준의 성능을 보여줄 수 있다."
"이 연구 결과는 LLM 기반 인공 공감 시스템이 사용자 경험 연구 프로세스를 확장할 수 있는 가능성을 보여준다."