Core Concepts
본 연구는 다국어 대규모 언어 모델을 활용하여 다양한 텍스트 소스에서 개체와 관계를 추출하고, 번역 사전과 그래프 신경망 기반의 의미 필터링을 통해 벵골어 지식 그래프를 자동으로 구축하는 혁신적인 접근 방식을 제안한다.
Abstract
본 연구는 벵골어 지식 그래프 구축을 위한 최초의 자동화된 접근 방식을 제안한다. 다국어 대규모 언어 모델을 활용하여 개체와 관계를 추출하고, 번역 사전과 BERT 기반 특징 개발, 그래프 신경망 기반의 특징 정제 및 의미 필터링을 통해 벵골어 지식 그래프를 자동으로 구축한다.
실험 결과와 사례 연구를 통해 BanglaAutoKG 모델의 범용성과 효과성을 입증한다. 시를 비롯한 다양한 텍스트 유형에서 의미 있는 지식 그래프를 자동으로 생성할 수 있음을 보여준다. 또한 모델 구성 요소의 중요성을 확인하는 ablation 연구를 수행한다.
본 연구는 벵골어 지식 그래프 구축을 위한 혁신적인 시도로, 정보 검색, 지식 발견, 사실 확인 등 다양한 응용 분야에서 활용될 수 있다. 나아가 벵골어 문화와 유산 보존, 혁신 및 경제 성장에 기여할 것으로 기대된다.
Stats
우리는 25일 3월에 독립을 위해 목숨을 걸고 싸웠다.
9개월 동안의 투쟁 끝에 우리는 마침내 독립을 쟁취했다.
우리는 모두 자유로운 숨을 쉬게 되었다.
Quotes
"우리는 모두 자유로운 숨을 쉬게 되었다."
"9개월 동안의 투쟁 끝에 우리는 마침내 독립을 쟁취했다."