核心概念
本文提出了DELTA框架,通过结构化词对齐任务和浅层解码器来增强法律案件编码器的判别能力,从而提高法律案件检索的性能。
要約
本文提出了DELTA,一种针对法律案件检索的预训练框架。DELTA包含以下几个关键组件:
事实编码器:将法律案件的事实部分编码为高质量的表示向量,以进行有效的检索。
浅层解码器:引入两个浅层解码器,分别用于重构法律案件的推理和裁决部分,从而增强[CLS]向量的表示能力。
结构化词对齐:通过深层解码器,DELTA学习从事实部分到推理部分的"翻译",从而识别事实部分中的关键事实。DELTA进一步通过对比学习,将[CLS]向量拉近关键事实,远离非关键事实,增强判别能力。
实验结果表明,DELTA在中英文法律案件检索基准上均显著优于现有的最先进方法。这为深入理解和处理法律案件文档提供了新的视角。
統計
在法律案件中,关键事实对最终判决至关重要,而非关键事实对判决影响较小。
法律案件通常包含三个部分:事实、推理和裁决。推理部分包含了所有关键事实,可以视为事实部分到推理部分的"翻译"过程。
引用
"在法律领域,文本语义相似性并不总是意味着案件之间存在足够的相关性。相反,法律案件的相关性主要取决于影响最终判决的关键事实的相似性。"
"如果表示集中于捕捉不重要的事实,则即使语义表示更好,也不一定会导致更好的法律相关性判别。"