Core Concepts
핵 사업자 사건 보고서의 비정형 데이터에서 인과관계를 효과적으로 추출하기 위해 딥러닝과 지식 기반 접근법을 결합한 하이브리드 프레임워크를 제안하였다.
Abstract
이 연구는 핵 전력 산업의 운영 경험 데이터에서 인과관계를 효과적으로 추출하기 위한 하이브리드 프레임워크를 제안하였다.
데이터 전처리 단계에서는 핵 사업자 사건 보고서(LER)에서 관련 정보를 선별하고 정제하였다. 이후 두 단계로 구성된 방법론을 적용하였다:
인과관계 분류: 딥러닝 모델을 사용하여 문장 단위로 인과관계 유무를 분류하였다. 이 모델은 단어 임베딩, 합성곱 신경망, 양방향 LSTM 등의 기법을 활용하여 높은 정확도를 달성하였다.
인과관계 추출: 인과관계가 있는 것으로 분류된 문장에서 핵심 키워드 기반의 패턴 매칭 기법을 사용하여 원인과 결과 요소를 정확하게 추출하였다.
이 하이브리드 접근법은 비정형 텍스트 데이터에 내재된 복잡한 인과관계를 효과적으로 파악할 수 있었다. 향후 연구에서는 데이터 규모 확대, 추가 레이블링, 대규모 언어 모델 활용 등을 통해 성능 향상을 도모할 계획이다.
Stats
핵 사업자 사건 보고서에서 "due to"가 가장 많이 사용된 인과관계 패턴이었다.
"cause of"가 두 번째로 많이 사용되었고, "caused by", "resulted in", "as a result of" 등의 패턴도 확인되었다.
Quotes
"이 연구는 핵 전력 산업의 운영 경험 데이터에서 인과관계를 효과적으로 추출하기 위한 하이브리드 프레임워크를 제안하였다."
"딥러닝 모델을 사용하여 문장 단위로 인과관계 유무를 분류하였고, 키워드 기반 패턴 매칭 기법으로 원인과 결과 요소를 정확하게 추출하였다."