本論文は、語彙意味変化検出(Lexical Semantic Change Detection: LSCD)のための包括的なベンチマークを提案している。
LSCD は、単語の意味が時間とともにどのように変化するかを分析するタスクである。このタスクは以下の3つのサブタスクから成る:
本ベンチマークは、これらのサブタスクを統一的に評価できる枠組みを提供する。これにより、モデルの比較と改善が容易になる。
ベンチマークには、5か国語(ドイツ語、英語、スウェーデン語、スペイン語、ロシア語)の複数のデータセットが統合されている。これらのデータセットには、単語の使用例に対する人手による意味的近接性の評価が含まれており、WiC、WSI、LSDCの各タスクの評価が可能である。
本ベンチマークの利用により、研究者はLSCDモデルの開発と改善を促進できると期待される。特に、マルチリンガルなモデルの評価と改善に役立つと考えられる。
To Another Language
from source content
arxiv.org
Key Insights Distilled From
by Dominik Schl... at arxiv.org 04-02-2024
https://arxiv.org/pdf/2404.00176.pdfDeeper Inquiries