핵심 개념
GPT-4는 인간의 답변과 강한 상관관계를 보이며 사회적 상호작용 시나리오에서 사람들의 선호도와 가치를 잘 반영한다.
통계
GPT-4는 두 연구에서 강한 상관관계를 보이며, 다른 모델들보다 우수한 성능을 보인다.
LLMs는 사람들이 로봇과 인간이 행동을 평가하는 데 어려움을 겪으며, 특히 일부 형태의 의사소통 및 행동 선호도를 과대평가하는 경향이 있다.
인용구
"GPT-4는 다른 모델들보다 더 강한 상관관계를 보이며, 특히 의사소통 행동 및 행동 판단에 대해 사람들의 답변과 일치하는 결과를 생성한다."
"LLMs는 사람들의 판단에 따라 행동을 평가하는 데 어려움을 겪고, 특히 일부 형태의 의사소통 및 행동 선호도를 과대평가하는 경향이 있다."