이 논문은 데이터 품질 향상을 위한 자동화된 설명 가능한 프레임워크를 제안한다. 이 프레임워크는 도메인 지식 없이도 데이터 세트의 결측값, 중복, 통계적 이상치, 철자 오류, 논리적 오류를 식별하고 수정할 수 있다.
프레임워크는 두 단계로 구성된다:
각 단계에서는 결과에 대한 설명과 해석을 제공하여 사용자가 신뢰할 수 있도록 한다. 이 프레임워크를 공개 데이터 세트에 적용하여 그 효과를 입증하고, 통계적 이상치와 논리적 오류 처리에 대한 과제를 논의한다.
إلى لغة أخرى
من محتوى المصدر
arxiv.org
الرؤى الأساسية المستخلصة من
by Djibril Sarr في arxiv.org 09-17-2024
https://arxiv.org/pdf/2409.10139.pdfاستفسارات أعمق