本文提出了一种利用大型语言模型(LLM)对中文语音识别系统输出的全文进行错误纠正的方法。
首先,作者构建了一个中文全文错误纠正数据集ChFT,包括文本收集、语音合成、语音识别和错误纠正对提取等步骤。该数据集具有以下特点:
其次,作者设计了四种提示模板,考虑了输入文本长度(全文或段落)和输出格式(直接纠正文本或JSON格式的错误-纠正对)。
最后,作者使用ChatGLM模型在ChFT数据集上进行微调,并在不同测试集上评估性能。结果表明:
总的来说,本文提出的方法为利用LLM进行全文错误纠正提供了一个有效的基准,为进一步研究奠定了基础。未来将探索使用真实音频数据的场景,并设计更加高级的提示模板以进一步提升纠错性能。
In un'altra lingua
dal contenuto originale
arxiv.org
Approfondimenti chiave tratti da
by Zhiyuan Tang... alle arxiv.org 09-13-2024
https://arxiv.org/pdf/2409.07790.pdfDomande più approfondite