이 조사는 개체명 인식(NER)과 관계 분류(RC) 작업에 대한 최근 딥러닝 모델을 다룬다. 특히 소수 샘플 학습 성능에 초점을 맞추고 있다.
NER 작업은 텍스트에서 개체를 식별하고 미리 정의된 개체 유형 중 하나로 분류하는 것을 목표로 한다. RC 작업은 두 개체 간의 관계가 존재하는지 확인하고 미리 정의된 관계 중 하나로 분류하는 것을 목표로 한다.
조사에서는 NER과 RC 작업을 모두 다루는 통합 모델, NER 전용 모델, RC 전용 모델을 소개한다.
통합 모델은 개체와 관계를 동시에 추출한다. 이러한 접근법은 개체 추출 오류가 관계 추출 단계로 전파되는 문제를 해결한다.
NER 전용 모델은 중첩 개체와 평면 개체를 모두 다룰 수 있는 포괄적인 모델, 평면 개체만 다루는 모델, 문서 수준 모델로 구분된다.
RC 전용 모델은 소수 샘플 학습 모델과 지도 학습 모델로 구분된다. 소수 샘플 학습 모델은 적은 수의 레이블된 데이터로도 효과적으로 학습할 수 있다.
각 모델의 주요 특징과 성능 지표를 요약하였다.
다른 언어로
소스 콘텐츠 기반
arxiv.org
더 깊은 질문