Belangrijkste concepten
ロシア・ウクライナ戦争の影響を軽減するために、ウクライナ語とチェコ語の間の機械翻訳システム「Charles Translator」を開発した。
Samenvatting
本論文では、ウクライナ語とチェコ語の間の機械翻訳システム「Charles Translator」について説明する。
開発の背景:
- 2022年2月のロシアのウクライナ侵攻を受け、チェコ共和国はウクライナからの避難民を受け入れる主要国の1つとなった。
- 避難民とチェコ人の間のコミュニケーションを支援するため、高品質な機械翻訳サービスの必要性が急速に高まった。
- 研究者らが迅速に取り組み、ウクライナ語とチェコ語の機械翻訳システムを開発した。
システムの概要:
- Transformer アーキテクチャと反復ブロック逆翻訳法を使用
- 多様なボランティアから収集した並行コーパスと単言語コーパスを使用して学習
- ウェブアプリ、Androidアプリ、APIなどの複数のインターフェースを提供
- 固有名詞の処理、発話音声入力、チリル文字とラテン文字の相互変換などの機能を実装
評価:
- 自動評価では主要なシステムと遜色ない性能を発揮
- 一部の固有名詞の翻訳に課題が残る
利用事例:
- 避難民支援NGO、警察などが利用
- 2023年9月時点で1日平均30,000件のウクライナ語→チェコ語、12,000件のチェコ語→ウクライナ語の翻訳リクエストを処理
今後の展開:
Statistieken
2022年4月時点で、チェコ共和国にはウクライナからの避難民が50万4,000人以上いた。
2023年9月時点で、ウクライナ語→チェコ語の翻訳は1日平均30,000件、チェコ語→ウクライナ語は12,000件だった。
2022年4月のピーク時には、チェコ語→ウクライナ語の翻訳が1日223万文字に達した。