Core Concepts
합성 데이터 사용은 데이터 다양성과 대표성 향상에 대한 잘못된 자신감을 초래하고, 데이터 사용에 대한 동의를 회피할 수 있다.
Abstract
이 논문은 합성 데이터 사용의 두 가지 주요 위험을 다룹니다.
첫째, 합성 데이터를 사용하여 데이터 다양성과 대표성을 높이려는 시도가 실제로는 다양성 세탁으로 이어질 수 있다는 점을 설명합니다. 이는 실제 사례를 통해 입증됩니다.
둘째, 합성 데이터 사용이 데이터 사용에 대한 동의를 회피할 수 있다는 점을 보여줍니다. 이는 미국 연방거래위원회(FTC)의 데이터 수집 규제와 관련된 사례를 통해 설명됩니다.
이러한 두 가지 위험은 합성 데이터의 책임감 있는 사용을 어렵게 만들며, 데이터 생성자의 권력을 강화하고 데이터와 그것이 영향을 미치는 사람들을 분리시킬 수 있습니다. 향후 연구에서는 합성 데이터의 광범위한 사용과 활용을 검토하고, 그 위험을 완화하며 참여적 권한 부여를 가능하게 하는 방안을 모색해야 합니다.
Stats
합성 데이터를 사용하여 얼굴 인식 기술을 평가한 결과, 데이터 다양성과 대표성 향상에 대한 잘못된 자신감이 발생했다.
합성 데이터 사용은 데이터 사용에 대한 동의를 회피할 수 있으며, 이는 FTC의 데이터 수집 규제 집행에 영향을 미칠 수 있다.
Quotes
"합성 데이터 사용은 데이터 다양성과 대표성 향상에 대한 잘못된 자신감을 초래할 수 있다."
"합성 데이터 사용은 데이터 사용에 대한 동의를 회피할 수 있다."