이 논문은 정보 추출 작업에서 발생하는 데이터 정의 편향 문제를 체계적으로 분석하고 해결하기 위한 방법을 제안한다.
데이터 정의 편향이 존재하는지 확인하기 위해 교차 검증 실험을 수행했다. 실험 결과, 동일한 작업에서도 데이터셋 간 성능 차이가 크게 나타나 데이터 정의 편향이 존재함을 확인했다.
통합 정보 추출(UIE) 모델과 대규모 언어 모델(LLM)이 데이터 정의 편향을 해결할 수 있는지 분석했다. 실험 결과, UIE 모델은 데이터셋 간 정의 차이로 인해 일관된 결과를 내지 못했고, LLM도 정보 추출 데이터셋과 지시 학습 데이터셋 간 정의 차이로 인해 만족스러운 성능을 내지 못했다.
이러한 문제를 해결하기 위해 데이터 정의 편향 측정, 편향 인지 파인 튜닝, 작업 특화 편향 완화 등의 단계로 구성된 2단계 파인 튜닝 프레임워크를 제안했다. 실험 결과, 제안한 프레임워크가 데이터 정의 편향을 효과적으로 완화할 수 있음을 보였다.
Sang ngôn ngữ khác
từ nội dung nguồn
arxiv.org
Thông tin chi tiết chính được chắt lọc từ
by Wenhao Huang... lúc arxiv.org 03-26-2024
https://arxiv.org/pdf/2403.16396.pdfYêu cầu sâu hơn