Core Concepts
대규모 언어 모델(LLM)인 ChatGPT는 명시적인 온톨로지를 가지고 있지 않지만, 생성된 텍스트에 암묵적인 온톨로지적 범주화가 반영되어 있다.
Abstract
이 논문은 ChatGPT 3.5를 사례로 LLM의 암묵적 온톨로지적 약속을 체계화하고 분석한다.
온톨로지를 텍스트의 온톨로지적 약속을 체계적으로 설명하는 이론으로 정의한다. 이를 바탕으로 ChatGPT의 최상위 온톨로지를 제시한다. 이 온톨로지는 개체, 추상 개체, 구체 개체, 객체, 현상 등의 범주와 이들 간의 관계로 구성된다.
또한 이 온톨로지가 기존 최상위 온톨로지와 유사한 점과 차이점을 분석한다. ChatGPT의 온톨로지는 전통적인 범주 구분을 포함하지만, 용어의 유동성과 모순적인 응답으로 인해 명확한 정의와 일관성이 부족하다. 이는 LLM 기반 도구를 온톨로지 공학에 활용할 때 주요 과제가 될 것이다.
Stats
ChatGPT는 구체 개체와 추상 개체를 구분한다.
구체 개체에는 객체와 현상이 포함된다.
객체는 인공 객체와 자연 객체로 나뉘며, 자연 객체는 생물체와 무생물체로 구분된다.
현상에는 행동과 과정이 포함된다.
추상 개체에는 개념, 가치, 과정, 특성이 포함된다.
Quotes
"ChatGPT는 명시적인 온톨로지를 가지고 있지 않지만, 생성된 텍스트에 암묵적인 온톨로지적 범주화가 반영되어 있다."
"ChatGPT의 온톨로지는 전통적인 범주 구분을 포함하지만, 용어의 유동성과 모순적인 응답으로 인해 명확한 정의와 일관성이 부족하다."