核心概念
多言語音声モデルにおける自動音声認識の性別パフォーマンスギャップを評価し、ジェンダー間の不平等を明らかにする。
摘要
現在の音声認識アプローチは、多くの言語に適用可能なマルチタスク、マルチリンガルモデルを使用しています。しかし、19言語で3つのデータセット上で行われたシステム評価では、明確なジェンダー格差が見られました。内部状態を探ると、女性話者をより好むことが示されました。これらの結果は、マルチタスクやマルチリンガリティに関する進歩にもかかわらず、グループ間の不平等が解消されていないことを示しています。
統計資料
平均エラー率:男性話者と女性話者間で異なる(図1)
言葉エラー率(WER):Fleurs(12.68)、CV(17.51)、VP(13.59)
引述
"Our results show that group disparities remain unsolved despite great progress on multi-tasking and multilinguality."
"We conducted the first extensive evaluation of gender performance differences between two widely used multilingual ASR models."