LePaRD는 미국 연방 법원의 판결문에서 추출한 수백만 개의 선례 인용 사례를 포함하고 있다. 이 데이터셋은 법률 선례 검색이라는 실무 지향적인 법률 정보 검색 및 추론 작업을 지원하기 위해 구축되었다.
데이터셋 구축 과정에서 판결문에 인용된 선례 문구와 그 문맥을 추출하였다. 이를 통해 법관들이 실제로 사용한 선례 인용 사례를 대규모로 확보할 수 있었다.
LePaRD를 활용한 실험 결과, 법률 선례 검색은 매우 어려운 과제임이 드러났다. 가장 잘 수행한 모델도 상위 10개 결과 중 38%만 정답을 찾아내는 수준에 그쳤다. 이는 법률 선례 검색이 새로운 기술적 접근이 필요한 과제임을 보여준다.
LePaRD 데이터셋 공개를 통해 실무 지향적인 법률 NLP 연구를 촉진하고자 한다. 이를 통해 법률 연구 부담을 줄이고 사법 접근성을 높이는 데 기여할 수 있을 것으로 기대된다.
Vers une autre langue
à partir du contenu source
arxiv.org
Questions plus approfondies