이 논문은 개체명 인식(NER) 작업에서 문서 수준의 문맥 정보를 활용하는 방법을 제안한다. 최근 사전 학습된 트랜스포머 모델은 NER 작업에서 높은 정확도를 보이지만, 긴 문서에 적용할 경우 입력 길이 제한으로 인한 성능 저하가 발생한다. 이를 해결하기 위해 문서 수준의 관련 문맥을 검색하여 입력에 추가하는 방법을 제안한다.
논문에서는 먼저 Alpaca라는 지시 기반 대규모 언어 모델을 활용하여 합성 문맥 검색 데이터셋을 생성한다. 이 데이터셋을 이용하여 BERT 기반의 신경망 문맥 검색기를 학습한다. 이 문맥 검색기는 주어진 문장에 대해 관련 문맥 문장을 검색하고 순위를 매긴다.
실험 결과, 제안한 신경망 문맥 검색기는 비지도 문맥 검색 방법보다 우수한 성능을 보였으며, 수동으로 주석된 데이터셋을 이용해 학습한 재순위화 모델과 유사하거나 더 나은 성능을 보였다. 또한 생성에 사용한 언어 모델의 크기가 최종 성능에 큰 영향을 미치지 않는 것으로 나타났다.
다른 언어로
소스 콘텐츠 기반
arxiv.org
더 깊은 질문