Core Concepts
본 연구는 자연어 처리 기술과 기계 학습 알고리즘을 결합하여 스페인 법적 판결을 분류하고 그 결과를 자연어로 설명하는 시스템을 제안한다.
Abstract
본 연구는 자연어 처리 기술과 기계 학습 알고리즘을 결합하여 스페인 법적 판결을 분류하고 그 결과를 자연어로 설명하는 시스템을 제안한다.
데이터 전처리 모듈은 원본 데이터를 기계 학습 분류기의 입력 형식으로 변환한다. 메인 모듈은 특징 공학과 관할권별 병렬 분류 단계로 구성된다. 설명 모듈은 분류기의 결정 경로를 추출하고 관련 특징을 식별하며, 이를 자연어로 설명한다.
실험 결과, 제안 시스템은 90% 이상의 높은 분류 정확도를 달성했으며, 법률 전문가가 검증한 "전문가 참여" 사전을 통해 비전문가도 이해할 수 있는 수준의 자연어 설명을 제공했다. 이는 기존 연구와 달리 법적 텍스트 분류 결과를 해석 가능한 방식으로 제공한다는 점에서 의의가 있다.
Stats
스페인 법적 판결 96,163건의 평균 길이는 3,103단어/19,217자이다.
관할권별 법 범주 분포는 다음과 같다:
행정법: 10,475건
민사/상사법: 4,880건
민법: 18,355건
헌법: 653건
상법: 12,746건
형법: 20,864건
세법: 4,082건
노동법: 16,697건
Quotes
"본 연구는 자연어 처리 기술과 기계 학습 알고리즘을 결합하여 스페인 법적 판결을 분류하고 그 결과를 자연어로 설명하는 시스템을 제안한다."
"제안 시스템은 90% 이상의 높은 분류 정확도를 달성했으며, 법률 전문가가 검증한 "전문가 참여" 사전을 통해 비전문가도 이해할 수 있는 수준의 자연어 설명을 제공했다."