核心概念
IWSLT 2024評価キャンペーンでは、音声言語翻訳における7つの課題(同時翻訳、オフライン翻訳、自動字幕生成、吹き替え、音声合成による翻訳、方言と低リソース音声の翻訳、インド系言語)に対する最新の研究成果が報告され、音声言語翻訳への関心の高まりが示された。
本稿は、第21回IWSLT会議で開催された共有タスクに関する報告書であり、音声言語翻訳における最新の研究成果を概観するものである。
IWSLT 2024評価キャンペーンでは、音声言語翻訳における7つの科学的課題を対象とした共有タスクが設定された。
課題は以下の通りである。
オフライン音声翻訳:録音された会議やインタビューの英語からドイツ語、日本語、中国語への音声翻訳
同時音声翻訳:会議やインタビューのストリーミング音声の英語からドイツ語、日本語、中国語への音声翻訳
自動字幕生成:英語の音声映像資料のドイツ語とスペイン語への音声字幕翻訳、および事前に生成されたドイツ語とスペイン語の字幕の圧縮
音声合成による翻訳:録音された発話の英語から中国語への自然音声から合成音声への翻訳
自動吹き替え:制作品質の動画の英語から中国語への吹き替え
低リソース音声翻訳:録音された音声の、ボージュプリー語からヒンディー語、アイルランド語から英語、マラーティー語からヒンディー語、マルタ語から英語、北レバントアラビア語から英語、パシュトー語からフランス語、タマシェク語からフランス語、ケチュア語からスペイン語、ベンバ語から英語への翻訳
インド系言語トラック:TEDトーク音声の英語からヒンディー語、タミル語、ベンガル語を含むインド系言語への音声テキスト翻訳