Core Concepts
투영 기반 개념 제거 방법을 적용하면 데이터셋에 강력한 통계적 의존성이 주입되며, 변환된 표현 공간이 구조화되어 원래 레이블을 복구할 수 있다.
Abstract
이 논문은 투영 기반 개념 제거 방법을 적용한 데이터셋의 특성을 분석한다. 이론적 분석과 실험을 통해 다음과 같은 결과를 보여준다:
개념 제거 후 데이터셋에서 원래 레이블을 예측하는 정확도가 우연수준 이하로 떨어진다.
개념 제거 후 데이터셋에서 예측 확률 분포가 원래 데이터와 독립적인 데이터와 크게 다르다.
개념 제거 후 데이터셋에서 인스턴스들이 반대 레이블의 인스턴스들과 가까워지는 경향이 있다.
개념 제거 후 데이터셋에서 원래 레이블을 반군집 방법으로 복구할 수 있다.
이러한 결과는 투영 기반 개념 제거 방법이 데이터셋에서 개념 정보를 제거하는 것이 아니라 오히려 데이터셋에 구조적 의존성을 주입한다는 것을 보여준다. 이는 데이터셋 분석이나 배포 시 주의가 필요함을 시사한다.
Stats
개념 제거 후 데이터셋에서 원래 레이블을 예측하는 정확도가 우연수준 이하로 떨어진다.
개념 제거 후 데이터셋에서 예측 확률 분포가 원래 데이터와 독립적인 데이터와 크게 다르다.
개념 제거 후 데이터셋에서 인스턴스들이 반대 레이블의 인스턴스들과 가까워지는 경향이 있다.
개념 제거 후 데이터셋에서 원래 레이블을 반군집 방법으로 복구할 수 있다.