이 연구는 영어와 스웨덴어에서 기록되지 않은 단어 의미를 감지하는 모델을 개발하고자 합니다. 사전에 훈련된 Word-in-Context 임베더를 사용하여 목표 단어 사용 및 의미 임베딩을 생성하고 유사성에 기반하여 해당 사용이 재고된 의미와 일치하는지 여부를 결정합니다. 모델은 무작위 기준선에 비해 많은 수의 기록되지 않은 사용을 예측합니다. 이를 통해 WordNet 및 SO의 의미 인벤토리를 업데이트하는 데 도움이 될 수 있습니다. 모델은 현대와 역사적 데이터에서 다른 행동을 보이며 모델링 파이프라인의 일부 약점을 식별하고 향후 작업에 접근해야 합니다.
To Another Language
from source content
arxiv.org
Deeper Inquiries