本論文では、音声認識システムに依存しない単語誤り率推定(SIWE)手法を提案している。従来の単語誤り率推定手法は特定の音声認識システムに依存していたが、本手法では音声認識システムの出力を模擬的に生成することで、システムに依存しない推定を実現している。
具体的には、以下の手順で行う。
提案手法は、従来の音声認識システム依存の手法と同等の性能を示し、さらに異なるドメインのデータに対しても優れた性能を発揮することが示された。特に、訓練データの単語誤り率が評価データに近い場合に、良好な推定精度が得られることが確認された。
إلى لغة أخرى
من محتوى المصدر
arxiv.org
الرؤى الأساسية المستخلصة من
by Chanho Park,... في arxiv.org 04-26-2024
https://arxiv.org/pdf/2404.16743.pdfاستفسارات أعمق