Khái niệm cốt lõi
南アジアの低リソース言語における多言語共参照解決の重要性と成果を示す。
Tóm tắt
英語での共参照解決タスクが広く探求されているが、南アジア言語における資源やモデルが不足している。
TransMuCoResデータセットは31の南アジア言語で多言語共参照解決を導入し、75%以上の英文リファレンスが予測された翻訳と一致することを示した。
2つのモデルはTransMuCoResとヒンディー語コアファレンス解決データセットでトレーニングされ、最高パフォーマンスモデルはHindi golden setでLEA F1とCoNLL F1それぞれ64と68を達成した。
現在の共参照評価メトリックが分割先行詞を持つデータセットに適用された際の制限についても指摘している。
Thống kê
英文リファレンスが予測された翻訳と一致することを示した。
最高パフォーマンスモデルはHindi golden setでLEA F1とCoNLL F1それぞれ64と68を達成した。
Trích dẫn
"Coreference resolution involves the task of identifying text spans within a discourse that pertain to the same real-world entity."
"This study is the first to evaluate an end-to-end coreference resolution model on a Hindi golden set."