Core Concepts
通过机器学习和基于属性的相似性提高知识提取的质量,实现知识图谱的自动扩展。
Abstract
本论文研究了知识图谱自动扩展的问题。知识图谱的构建是一个多方面的过程,涉及各种技术,研究人员旨在从现有资源中提取知识进行构建,因为从头开始构建需要大量的人力和时间成本。然而,由于普遍存在的异质性问题,不同知识图谱之间的描述多样性可能导致概念之间的不匹配,从而影响知识提取的效果。
本研究重点关注自动知识图谱扩展,即通过从一个或多个候选知识图谱中提取和集成概念来适当扩展参考知识图谱。我们提出了一种基于实体类型识别的新颖知识图谱扩展框架。该框架旨在通过对齐不同知识图谱的模式和实体,提高知识提取的性能,从而增强扩展效果。
本文主要贡献包括:(i)我们提出了一种利用机器学习和基于属性的相似性来增强知识提取的实体类型识别方法;(ii)我们引入了一组评估指标来验证扩展知识图谱的质量;(iii)我们开发了一个用于知识图谱获取、管理和扩展的平台,以实际惠及知识工程师。我们的评估全面地通过定量实验和案例研究,证明了所提出的扩展框架及其功能的可行性和有效性。
Stats
知识图谱中实体类型"person"在不同知识图谱中共享的属性。
不同知识图谱中共享的实体类型。