本文针对特定领域(以中文煤化工行业为例)的命名实体识别问题提出了LLM-DER框架。主要包括以下三个部分:
关系列表生成:预定义特定领域的关系,并将实体类型信息关联到每个关系的两端,以增强语言模型对实体-关系的语义理解。然后利用语言模型的零样本学习能力生成一系列相似的多样化关系,进一步增强语言模型对实体的感知。
基于关系的实体识别:将生成的多样化关系列表作为提示输入到语言模型中,利用每个关系与实体之间的语义联系来确定文本中存在的实体并进行关联。
实体筛选和验证:在实体识别后,通过设计的可信度和一致性加权评估策略来消除错误识别的实体,提高识别准确性。
实验结果表明,LLM-DER在中文煤化工领域的命名实体识别任务上表现出色,不仅优于现有的GPT-3.5-turbo基线,还超过了完全监督的基线,验证了其在实体识别方面的有效性。
Sang ngôn ngữ khác
từ nội dung nguồn
arxiv.org
Thông tin chi tiết chính được chắt lọc từ
by Le Xiao, Yun... lúc arxiv.org 09-17-2024
https://arxiv.org/pdf/2409.10077.pdfYêu cầu sâu hơn