Core Concepts
사건의 물리적 및 추상적 개연성을 체계적으로 포착할 수 있으며, 단어의 추상성 정도를 통합하는 것이 개연성 이해와 모델링에 도움이 된다.
Abstract
이 연구는 영어 위키피디아에서 추출한 자연어 문장을 바탕으로 사건의 물리적 및 추상적 개연성을 체계적으로 다룹니다. 구체성과 추상성의 정도를 반영하여 실제 발생한 사건과 가상의 사건을 생성하고, 크라우드소싱을 통해 개연성에 대한 인간 평가를 수집했습니다.
분석 결과, 인간 평가자들은 개연성보다 비개연성에 대해 더 많은 의견 불일치를 보였습니다. 또한 사건의 구성 요소가 추상적일수록 개연성 평가가 높아지는 경향이 있었습니다. 이는 구체적인 단어가 현실 세계에 대한 안정된 정신적 이미지를 불러일으키는 반면, 추상적인 단어는 잠재적으로 개연성 있는 해석의 여지를 더 많이 제공하기 때문으로 해석됩니다.
Stats
사건의 구성 요소 중 구체적인 주어와 목적어일수록 비개연성 판단이 증가한다.
사건의 구성 요소 중 추상적인 동사일수록 비개연성 판단이 증가한다.
Quotes
"개연성은 텍스트에서의 발생 가능성이 아니라 세상에서의 발생 가능성에 의해 결정된다."
"개연성은 정도의 문제이며, 선호되는 것이 가장 개연성이 높은 것으로 간주된다."