핵심 개념
대규모 엔터프라이즈 데이터에 대한 자연어 쿼리를 위해 온톨로지를 점진적으로 공개하여 기성품 대형 언어 모델(LLM)을 효과적으로 활용하는 방법을 제시합니다.
초록
기성품 대형 언어 모델을 사용한 온톨로지 기반 엔터프라이즈 데이터 쿼리
본 문서는 연구 논문 형식이며, 대규모 엔터프라이즈 데이터에 대한 자연어 쿼리를 위해 온톨로지를 점진적으로 공개하여 기성품 대형 언어 모델(LLM)을 효과적으로 활용하는 방법을 제시합니다.
본 연구는 복잡하고 대규모인 엔터프라이즈 온톨로지를 감안하여, 기성품 LLM을 사용하여 대규모 데이터 세트에 대한 자연어 질문에 답변하는 효과적인 방법을 모색합니다.
본 연구에서는 LLM과 외부 서비스 간의 협업 프로세스를 통해 온톨로지를 점진적으로 공개하는 세 단계(근사화, 구체화, 변환) 파이프라인을 제안합니다.
근사화 단계: LLM은 자연어 온톨로지 설명에서 추출된 개념 및 관계의 이름을 입력 질문과 연결합니다.
구체화 단계: LLM은 온톨로지 슬라이스를 사용하여 자연어 질문을 SPARQL로 변환하려고 시도하고, 필요한 경우 누락된 개념 및 연결을 식별하여 온톨로지 슬라이스를 반복적으로 구체화합니다.
변환 단계: 최종 온톨로지 슬라이스를 기반으로 LLM은 자연어 질문을 SPARQL 쿼리로 변환하여 지식 그래프에서 실행합니다.