toplogo
Masuk

사이버 보안 지식 그래프 생성을 위한 계층적 비음수 행렬 분해


Konsep Inti
대규모 과학 문헌 데이터에서 의미론적 계층 비음수 행렬 분해를 통해 도메인 특화 지식 그래프를 구축하는 방법을 제시한다.
Abstrak

이 논문은 사이버 보안 분야의 방대한 과학 문헌 데이터에서 지식 그래프를 구축하는 방법을 제안한다.

  1. 데이터 전처리: arXiv에 게시된 200만 건 이상의 논문 초록을 수집하고 전처리한다.

  2. HSNMFk-SPLIT 방법: 계층적 비음수 행렬 분해 기법을 사용하여 데이터에서 의미론적 토픽과 하위 토픽을 자동으로 추출한다. 이 방법은 대규모 데이터에 대한 분산 처리와 토픽 수 자동 결정 기능을 제공한다.

  3. 지식 그래프 구축: 추출된 토픽, 키워드, 개체명 등의 정보를 활용하여 도메인 특화 지식 그래프를 구축한다. 이를 통해 사이버 보안 분야의 동향 파악, 관련 연구 논문 발견 등이 가능해진다.

실험 결과, 제안 방법을 통해 사이버 보안 분야의 세부 주제들을 효과적으로 추출하고 이를 바탕으로 의미 있는 지식 그래프를 구축할 수 있음을 보여준다.

edit_icon

Kustomisasi Ringkasan

edit_icon

Tulis Ulang dengan AI

edit_icon

Buat Sitasi

translate_icon

Terjemahkan Sumber

visual_icon

Buat Peta Pikiran

visit_icon

Kunjungi Sumber

Statistik
2,178,187개의 논문 초록 데이터를 분석했다. 10,280개의 단어로 구성된 어휘집을 사용했다. 172개의 arXiv 카테고리가 사용되었다.
Kutipan
"대규모 과학 문헌 데이터에서 의미론적 계층 비음수 행렬 분해를 통해 도메인 특화 지식 그래프를 구축하는 방법을 제시한다." "제안 방법을 통해 사이버 보안 분야의 세부 주제들을 효과적으로 추출하고 이를 바탕으로 의미 있는 지식 그래프를 구축할 수 있음을 보여준다."

Pertanyaan yang Lebih Dalam

사이버 보안 분야 외에 다른 도메인에서도 이 방법을 적용할 수 있을까?

이 방법은 사이버 보안 분야뿐만 아니라 다른 학문 분야에도 적용할 수 있습니다. 예를 들어, 의학 분야에서는 과학 논문을 분석하여 의학 지식 그래프를 구축할 수 있습니다. 이를 통해 의학 연구 동향을 파악하고 의학 전문가들이 새로운 연구 주제를 발견하는 데 도움이 될 수 있습니다. 또한, 금융 분야에서는 금융 논문을 분석하여 금융 지식 그래프를 만들어 금융 전문가들이 시장 동향을 이해하고 투자 결정을 내리는 데 도움을 줄 수 있습니다.
0
star