本研究は、オープンソースの音声基盤モデル(OSSFM)の開発に向けた取り組みである。まず、EU 24か国の公用語に対応した音声データを調査し、オープンソースライセンスで利用可能な950,000時間の音声データを収集した。さらに、441,000時間の無ラベル音声データに対して自動トランスクリプションを生成し、オープンソースライセンスで公開した。
収集したデータには以下の特徴がある:
さらに、最も低リソース言語の1つであるマルタ語を使って実験を行い、収集したデータを用いてASRモデルを訓練できることを示した。
Sang ngôn ngữ khác
từ nội dung nguồn
arxiv.org
Thông tin chi tiết chính được chắt lọc từ
by Marco Gaido,... lúc arxiv.org 10-03-2024
https://arxiv.org/pdf/2410.01036.pdfYêu cầu sâu hơn