本研究は、オープンソースの音声基盤モデル(OSSFM)の開発に向けた取り組みである。まず、EU 24か国の公用語に対応した音声データを調査し、オープンソースライセンスで利用可能な950,000時間の音声データを収集した。さらに、441,000時間の無ラベル音声データに対して自動トランスクリプションを生成し、オープンソースライセンスで公開した。
収集したデータには以下の特徴がある:
さらに、最も低リソース言語の1つであるマルタ語を使って実験を行い、収集したデータを用いてASRモデルを訓練できることを示した。
In un'altra lingua
dal contenuto originale
arxiv.org
Approfondimenti chiave tratti da
by Marco Gaido,... alle arxiv.org 10-03-2024
https://arxiv.org/pdf/2410.01036.pdfDomande più approfondite