本論文では、SemEval-2024 Task 1: Semantic Textual Relatedness (STR)のためのシステムAAdaM(Augmentation and Adaptation for Multilingual STR)を紹介しています。
主な取り組みは以下の通りです:
データ拡張: 機械翻訳を用いて、低リソース言語のデータを拡張しました。
課題適応事前学習: 教師なしタスクデータを使って、事前学習モデルを課題に適応させました。
監督学習: 完全微調整とアダプター微調整の2つのアプローチを検討し、言語ごとに最適なものを選択しました。
交差言語転移: アダプター枠組みを活用し、ソース言語の選択に注力しました。
実験の結果、我々のシステムは両サブタスクで優れた成績を収めました。特に、スペイン語とインドネシア語、パンジャブ語での性能が際立っています。
Till ett annat språk
från källinnehåll
arxiv.org
Djupare frågor