核心概念
低リソース言語のニューラル機械翻訳の向上に関する研究とその重要性に焦点を当てる。
摘要
デジタル時代は、機械学習(ML)や自然言語処理(NLP)の革新をもたらし、難解な問題に対する解決策を提供しています。 機械翻訳(MT)は、これまで数々の進歩を遂げてきましたが、これらの高度なモデルを低リソース言語に展開する際には依然として課題が残っています。 特に英語からアイルランド語へのペア(EN↔GA)は固有の挑戦を提供します。欧州連合は、市民、企業、政府がサービスに完全アクセスできるよう公平な競争条件を確保するためにすべての言語でデジタルサービスが利用可能であることの重要性を強調しています。 この研究では、低リソース言語技術の課題に対処するためのアプリケーションや方法論を開発し、DL技術へのデータ不足問題も解決します。 EN↔GAなど低リソース言語向けニューラル機械翻訳(NMT)の可能性を最大限活用することで、アイルランド語や他の資源が少ない言語へのサポート均等性を提供します。
統計資料
EU Digital Single Market 2018: デジタル単一市場2018年
BLEU (Papineni et al. 2002): BLEUスコア(Papineni et al. 2002)
back-propagation (Rumelhart et al. 1986): バックプロパゲーション(Rumelhart et al. 1986)
引述
"EU flags the importance of digital services being available in all languages to ensure a level playing field and full access to services for citizens, companies, and governments."
"This research helps deliver parity in support for Irish and other less-resourced languages."