Core Concepts
기업에서 지식 그래프와 자연어 처리를 결합하면 데이터 관리와 의사 결정 프로세스의 효율성과 효과성을 높일 수 있다.
Abstract
이 논문은 기업에서 지식 그래프(KG)와 자연어 처리(NLP)를 결합하는 사용 사례를 분석한다.
KG 구축 단계에서는 텍스트에서 개체, 관계, 속성을 추출하고 통합하는 NLP 기술을 활용한다. 이를 통해 다양한 정보원의 데이터를 구조화된 지식 그래프로 구축할 수 있다.
KG 추론 단계에서는 그래프 내 지식을 활용하여 개체 분류, 관계 추론, 오류 탐지 등을 수행한다. 이를 통해 KG의 정확성과 완전성을 높일 수 있다.
KG 기반 NLP 응용 단계에서는 지식 그래프의 구조화된 정보를 활용하여 의미 검색, 질의 응답, 대화형 인터페이스 등의 기능을 구현할 수 있다. 이를 통해 기업 데이터의 효과적인 활용과 의사 결정 지원이 가능해진다.
다양한 산업 분야에서 KG와 NLP를 결합한 사례가 제시되었는데, 주요 분야로는 엔지니어링, 법률, 출판, 금융 등이 있다. 이를 통해 기업이 보유한 데이터와 지식을 효과적으로 관리하고 활용할 수 있음을 보여준다.
Stats
과학 논문 수는 2015년부터 2020년 사이 연간 5-6.5% 증가했고, 저널 수는 연간 2-3% 증가했다.
마이크로소프트 학술 지식 그래프(MAG)는 과학 지식을 계층적으로 구조화하여 연구자와 기업이 관련 연구를 효과적으로 탐색할 수 있도록 지원한다.
TechNet은 1976-2017년 미국 특허 데이터베이스에서 추출한 기술 개념과 관계를 포함하는 의미 네트워크로, 엔지니어링 및 기술 분야의 다양한 응용에 활용될 수 있다.
Quotes
"기업 데이터 관리의 핵심 과제는 디지털 저장소에 데이터를 저장하는 것이 아니라 압도적인 데이터 속에서 관련 정보를 검색하는 것이다."
"지식 그래프는 데이터 항목 간 높은 연결성을 가진 분야에서 특히 유용하며, 전통적인 관계형 데이터베이스보다 더 유연하고 표현력 있는 방식으로 지식을 모델링할 수 있다."