이 논문은 LSCD(Lexical Semantic Change Detection) 작업을 위한 벤치마크를 제안한다. LSCD는 단어 의미의 변화를 자동으로 분석하는 NLP 분야로, 다음의 3단계로 구성된다:
이 작업은 모듈화되어 있어 다양한 모델링 옵션과 작업 정의가 가능하지만, 이로 인해 모델 평가와 결과 재현이 어려워진다. 이를 해결하기 위해 이 논문은 LSCD 작업을 표준화하고 평가할 수 있는 벤치마크를 제안한다.
벤치마크에는 WiC, WSI, LSCD 작업을 모두 평가할 수 있는 데이터셋이 통합되어 있다. 이를 통해 LSCD 모델의 개별 구성 요소와 전체 파이프라인을 체계적으로 평가할 수 있다. 또한 다국어 모델 평가와 다양한 역사적 시기에 대한 평가가 가능하다.
이 벤치마크는 LSCD 모델 개발과 개선을 위한 출발점이 될 것으로 기대된다.
To Another Language
from source content
arxiv.org
Viktige innsikter hentet fra
by Dominik Schl... klokken arxiv.org 04-02-2024
https://arxiv.org/pdf/2404.00176.pdfDypere Spørsmål