이 논문은 데이터 품질 향상을 위한 자동화된 설명 가능한 프레임워크를 제안한다. 이 프레임워크는 도메인 지식 없이도 데이터 세트의 결측값, 중복, 통계적 이상치, 철자 오류, 논리적 오류를 식별하고 수정할 수 있다.
프레임워크는 두 단계로 구성된다:
각 단계에서는 결과에 대한 설명과 해석을 제공하여 사용자가 신뢰할 수 있도록 한다. 이 프레임워크를 공개 데이터 세트에 적용하여 그 효과를 입증하고, 통계적 이상치와 논리적 오류 처리에 대한 과제를 논의한다.
Sang ngôn ngữ khác
từ nội dung nguồn
arxiv.org
Thông tin chi tiết chính được chắt lọc từ
by Djibril Sarr lúc arxiv.org 09-17-2024
https://arxiv.org/pdf/2409.10139.pdfYêu cầu sâu hơn