이 논문은 사이버 보안 분야의 방대한 과학 문헌 데이터에서 지식 그래프를 구축하는 방법을 제안한다.
데이터 전처리: arXiv에 게시된 200만 건 이상의 논문 초록을 수집하고 전처리한다.
HSNMFk-SPLIT 방법: 계층적 비음수 행렬 분해 기법을 사용하여 데이터에서 의미론적 토픽과 하위 토픽을 자동으로 추출한다. 이 방법은 대규모 데이터에 대한 분산 처리와 토픽 수 자동 결정 기능을 제공한다.
지식 그래프 구축: 추출된 토픽, 키워드, 개체명 등의 정보를 활용하여 도메인 특화 지식 그래프를 구축한다. 이를 통해 사이버 보안 분야의 동향 파악, 관련 연구 논문 발견 등이 가능해진다.
실험 결과, 제안 방법을 통해 사이버 보안 분야의 세부 주제들을 효과적으로 추출하고 이를 바탕으로 의미 있는 지식 그래프를 구축할 수 있음을 보여준다.
Naar een andere taal
vanuit de broninhoud
arxiv.org
Belangrijkste Inzichten Gedestilleerd Uit
by Ryan Barron,... om arxiv.org 03-26-2024
https://arxiv.org/pdf/2403.16222.pdfDiepere vragen