Centrala begrepp
복잡한 법률 텍스트의 이해를 돕기 위해 다단계 요약 기법을 활용한 무감독 질문 답변 시스템을 제안한다.
Sammanfattning
이 논문은 SemEval-2024 Task 5: 민사소송법 논거 추론 과제에 대한 팀 SCaLAR의 연구 내용을 요약한다. 복잡한 법률 텍스트로 인한 어려움을 해결하기 위해, 저자들은 유사성과 거리 기반의 간단하지만 새로운 무감독 접근법을 제안했다. 또한 CNN, GRU, LSTM 등의 앙상블 특징을 활용한 Legal-BERT 임베딩의 다단계 융합을 탐구했다. 데이터셋의 긴 법률 설명을 다루기 위해 T5 기반의 세그먼트 단위 요약을 도입했으며, 이를 통해 핵심 정보를 유지하면서 모델 성능을 향상시켰다. 제안된 무감독 시스템은 개발 세트에서 20점, 테스트 세트에서 10점의 macro F1 점수 향상을 보였다.
Statistik
데이터셋에는 총 666개의 학습 데이터, 84개의 개발 데이터, 98개의 테스트 데이터가 포함되어 있다.
학습 및 개발 세트에는 질문, 답변, 설명, 레이블(0 또는 1), 분석, 완전한 분석 등의 필드가 포함되어 있다.
레이블이 1인 경우 정답, 0인 경우 오답을 의미한다.
설명 필드에는 각 질문에 대한 배경 정보와 맥락이 제공된다.