מושגי ליבה
법률 문서의 문장들을 다양한 수사적 역할(서문, 사실 내용, 증거, 논리 등)로 자동 분류하는 기술을 향상시키기 위해 유사한 사례들의 지식을 활용하는 방법을 제안한다.
תקציר
이 연구는 법률 문서의 문장들을 다양한 수사적 역할(서문, 사실 내용, 증거, 논리 등)로 자동 분류하는 기술을 향상시키기 위한 방법을 제안한다.
- 법률 문서는 문맥 의존성, 역할 간 중첩, 주석 데이터 부족, 레이블 불균형 등의 특징으로 인해 수사적 역할 레이블링에 어려움이 있다.
- 이 연구는 유사한 사례들의 지식을 활용하는 두 가지 접근법을 제안한다:
- 추론 기반 접근법: 학습된 모델의 예측 결과와 유사 사례들의 레이블 분포를 보간하여 성능을 향상시킨다.
- 학습 기반 접근법: 대조 학습, 프로토타입 학습 등을 통해 유사 사례들의 관계를 직접 학습에 반영한다.
- 실험 결과, 제안 방법들이 기존 모델 대비 특히 레이블 불균형이 큰 상황에서 성능을 크게 향상시킴을 보였다.
- 또한 제안 방법들은 다른 법률 도메인으로의 지식 전이 성능도 개선하였다.
סטטיסטיקה
법률 문서는 문맥 의존성, 역할 간 중첩, 주석 데이터 부족, 레이블 불균형 등의 특징을 가진다.
기존 연구에서는 문장 단위 분류와 문맥을 고려한 계층적 모델링 등이 시도되었으나, 데이터 부족과 레이블 불균형 문제는 여전히 해결되지 않았다.
ציטוטים
"법률 문서는 광범위한 길이, 긴 문장, 비정상적인 단어 순서, 잦은 교차 참조, 광범위한 인용 사용, 복잡한 어휘 등의 특징을 가져 일상 언어와 구분되는 법률 용어로 간주된다."
"수사적 역할 레이블링은 사례 요약, 의미 검색, 논증 채굴 등 다양한 작업에 필수적이지만, 문맥 의존성, 역할 간 중첩, 주석 데이터 부족, 레이블 불균형 등의 과제를 가진다."