本文针对特定领域(以中国煤化工行业为例)的命名实体识别问题提出了LLM-DER框架。该框架主要包括以下三个部分:
关系列表生成:预定义特定领域的关系,并将关系两端的实体类型信息关联,以增强大型语言模型(LLM)对实体语义的理解。然后利用LLM的零样本学习能力生成一系列相似的关系,进一步丰富LLM对实体的感知。
基于关系的实体识别:将生成的关系列表作为提示输入到LLM中,利用每个关系与实体之间的语义联系来确定文本中存在的实体并进行关联。
实体筛选和验证:在实体识别后,通过设计的可信度和一致性加权评估策略来消除LLM可能产生的错误识别,提高实体识别的准确性。
实验结果表明,LLM-DER在中国煤化工领域的命名实体识别任务中表现出色,不仅优于现有的GPT-3.5-turbo基线,还超过了完全监督的基线,验证了其在特定领域实体识别方面的有效性。
Sang ngôn ngữ khác
từ nội dung nguồn
arxiv.org
Thông tin chi tiết chính được chắt lọc từ
by Le Xiao, Yun... lúc arxiv.org 09-17-2024
https://arxiv.org/pdf/2409.10077.pdfYêu cầu sâu hơn