本文提出了一种基于大型语言模型的命名实体识别框架LLM-DER,通过预定义关系并关联实体类型信息来增强语言模型对实体的语义理解,并设计了可信度和一致性加权评估方法来消除错误识别的实体,从而有效解决了特定领域复杂结构实体识别问题。
本文提出了一种基于大型语言模型的命名实体识别框架LLM-DER,通过生成包含实体类型信息的关系列表来增强模型对实体的语义理解,并设计了可信度和一致性加权评估方法来有效地消除错误识别的实体,从而解决了特定领域复杂实体结构识别的问题。
提出了一种新的基于检索增强生成(LA-RAG)的大语言模型自动语音识别范式,通过利用细粒度的语音数据存储和语音到语音的检索机制,增强了大语言模型的上下文学习能力,从而显著提高了自动语音识别的准确性,特别是在处理口音变化的场景中。
本文提出了一种利用大型语言模型对中文语音识别全文进行错误纠正的方法。通过构建中文全文错误纠正数据集ChFT,并设计多种提示模板,对预训练的大型语言模型进行微调,在全文和片段层面上均取得了良好的纠错性能。
本文提出了一种利用大型语言模型(LLM)对中文语音识别系统输出的全文进行错误纠正的方法。通过构建中文全文错误纠正数据集ChFT,并设计不同的提示模板,对ChatGLM模型进行微调,在全文和段落两个维度上评估其纠错性能。实验结果表明,LLM在全文错误纠正任务中表现良好,并且不同提示模板各有优缺点。这为进一步研究奠定了基础。
通过结合话语重写技术和无监督学习算法,提出了一种新颖的无监督对话主题分割方法,有效利用了未标记对话中的有用线索,显著提高了主题分割的准确性。
通过结合话语重写技术和无监督学习算法,提出了一种新颖的无监督对话主题分割方法,有效利用未标记的对话数据中的有用线索,显著提高了主题分割的准确性。
本文提出了一个新的中文知识校正基准数据集CKnowEdit,涵盖了中国古典文学、成语、谚语等多种类型的中文特有知识,以评估当前大型语言模型在处理中文知识方面的局限性。
本文提出了一个新的中文数据集CKnowEdit,用于评估大型语言模型中中文知识的纠正。通过对现有知识编辑方法在该数据集上的评估,发现了在处理中文特有的语言和文化知识方面的局限性,呼吁需要开发针对中文的更加先进的知识编辑技术。
本研究通过情感分析和语义分析比较了谷歌翻译和人工翻译的质量,发现谷歌翻译在翻译中国经典小说《阿Q正传》时存在一些局限性,无法完全准确地传达原文的情感和语义。