이 연구는 영어와 스웨덴어에서 기록되지 않은 단어 의미를 감지하는 모델을 개발하고자 합니다. 사전에 훈련된 Word-in-Context 임베더를 사용하여 목표 단어 사용 및 의미 임베딩을 생성하고 유사성에 기반하여 해당 사용이 재고된 의미와 일치하는지 여부를 결정합니다. 모델은 무작위 기준선에 비해 많은 수의 기록되지 않은 사용을 예측합니다. 이를 통해 WordNet 및 SO의 의미 인벤토리를 업데이트하는 데 도움이 될 수 있습니다. 모델은 현대와 역사적 데이터에서 다른 행동을 보이며 모델링 파이프라인의 일부 약점을 식별하고 향후 작업에 접근해야 합니다.
In un'altra lingua
dal contenuto originale
arxiv.org
Approfondimenti chiave tratti da
by Jona... alle arxiv.org 03-05-2024
https://arxiv.org/pdf/2403.02285.pdfDomande più approfondite