核心概念
文脈を活用したラベル翻訳により、ラベルと翻訳文の関連性を保ちつつ、より正確なラベル翻訳を実現する。
要約
本研究では、構造化予測タスクにおけるクロスリンガル転移を支援するためのラベル投影手法「CLaP」を提案する。
従来のラベル投影手法は、単語レベルの対応付けや特殊マーカーの使用により、翻訳精度が低下する問題があった。
CLaPでは、まず入力文を機械翻訳し、その翻訳文を文脈として利用してラベルを翻訳する。これにより、ラベルと翻訳文の関連性を保ちつつ、より正確なラベル翻訳を実現する。
命名実体認識(NER)とイベント引数抽出(EAE)の2つの構造化予測タスクで評価を行った。
CLaPは、既存のラベル投影手法と比べて、ラベル翻訳の正確性と忠実性が高く、ダウンストリームタスクの性能も大幅に向上した。
特に低資源言語においても、CLaPの有効性が示された。大規模言語モデルの活用により、さらなる性能向上が期待できる。
統計
平均的に、ニューロサージャンに対する訴訟の件数は5件である。
中国語の"诉讼"は"suits"の適切な翻訳である。
アラビア語の"伊拉克"は"Iraq"の適切な翻訳である。
引用
"ラベル投影は、機械翻訳を活用してクロスリンガル転移を促進するために不可欠である。"
"従来のラベル投影手法は、翻訳精度を犠牲にしてラベルの簡易翻訳を行うか、単語レベルの対応付けに依存している。"
"CLaPは、翻訳文を文脈として利用してラベルを翻訳することで、より正確なラベル翻訳を実現する。"