Core Concepts
利用大型语言模型(LLM)开发一种自动化的法律案件相关性注释方法,通过分步骤的专家指导和示范匹配,实现与人工注释高度一致的相关性判断。
Abstract
本文提出了一种利用大型语言模型(LLM)进行法律案件相关性自动注释的方法。该方法包括以下几个步骤:
- 法律专家预先分析案件事实,提取关键的事实信息(包括事实事项和法律事项)并提供示范。
- 采用自适应示范匹配(ADM)从预构建的专家示范集中选择合适的示范,以最大程度贴近输入案件。
- 分步骤提取事实信息(FE):首先提取案件的事实事项,然后基于事实事项提取法律事项。
- 基于提取的事实信息进行相关性注释(FA):利用正负示范引导LLM判断两个案件之间的相关性,并给出综合评分。
通过实验验证,该方法的注释结果与人工标注高度一致,体现了良好的可靠性和有效性。此外,利用该方法生成的合成数据,可以显著提升现有法律案件检索模型的性能。
Stats
以下是支持作者论点的关键数据:
案件相关性的判断主要依赖于案件的关键事实,包括"事实事项"和"法律事项"。事实事项包括涉案人员、犯罪动机、犯罪过程、结果等,法律事项包括对事实的法律评价。
人工标注案件相关性需要大量的法律专业知识和长篇文本阅读,是一项耗时且专业性强的任务。
Quotes
以下是支持作者论点的关键引用:
"收集法律案件检索的相关判断是一项具有挑战性和耗时的任务。准确判断两个法律案件之间的相关性需要大量阅读冗长文本的努力,以及高水平的领域专业知识来提取法律事实并做出法律判断。"