核心概念
多言語言語モデルの交差言語転移能力は、ソース言語とターゲット言語の間の語彙の重複度に大きく依存する。対抗的な入力変化に対してもある程度のロバスト性を示すが、その程度は言語ペアによって異なる。
要約
本研究は、多言語言語モデルの交差言語転移能力と、対抗的な入力変化に対するロバスト性を評価することを目的としている。13の言語ペアを対象に、2つの有名な多言語言語モデル(MBERT、XLM-R)を用いて、固有表現抽出(NER)とタイトル予測の2つのタスクを実施した。
NERタスクでは、以下の4つの入力変化を行った:
- 人名(PER)の置換
- 地名(LOC)の置換
- ターゲット言語(L2)のテストデータ中の重複する固有表現をL2固有の表現に置換
- L1の訓練データに含まれる単語をL2の固有の単語に置換
タイトル予測タスクでは、L1の訓練データに含まれる単語をL2の固有の単語に置換する変化を行った。
結果として以下のことが明らかになった:
- NERタスクでは、ソース言語(L1)とターゲット言語(L2)の間の語彙の重複度が高いほど、交差言語転移の性能が良い。
- 対抗的な入力変化に対して、交差言語転移モデルはネイティブモデルよりもある程度ロバストである。
- タイトル予測タスクでは、単語の記憶に大きく依存しており、対抗的な変化に脆弱である。
統計
人名(PER)の置換により、NERのマクロF1スコアが0-4%変化し、PERクラスのF1スコアが1-13%変化した。
地名(LOC)の置換により、NERのマクロF1スコアが1-13%変化し、LOCクラスのF1スコアが1-27%変化した。
L2のテストデータ中の重複する固有表現を置換すると、NERのマクロF1スコアが9.66ポイント低下した。
L1の訓練データに含まれる単語をL2の固有の単語に置換すると、タイトル予測の正解率が5.38ポイント低下した。