Core Concepts
다운스트림 과제 성능을 활용하여 합성 데이터의 유용성을 향상시키는 DSF-GAN 모델을 제안합니다.
Abstract
이 논문은 합성 테이블 데이터의 유용성을 높이기 위한 새로운 GAN 아키텍처인 DSF-GAN(Downstream Feedback Generative Adversarial Network)을 소개합니다.
주요 내용은 다음과 같습니다:
기존 GAN 모델의 손실 함수에 다운스트림 과제(분류 또는 회귀)의 손실 함수를 추가하여 합성 데이터의 유용성을 높임
두 개의 데이터셋(주택 가격, 성인 인구조사)을 사용하여 DSF-GAN의 성능을 평가
DSF-GAN으로 생성된 합성 데이터를 사용하여 학습한 모델이 실제 데이터로 학습한 모델보다 성능이 향상됨을 확인
이를 통해 합성 데이터의 유용성을 높이고 실제 과제 수행에 활용할 수 있는 방법을 제시합니다.
Stats
합성 데이터를 사용한 분류 모델의 정밀도가 0.598, 재현율이 0.485로 향상되었습니다.
합성 데이터를 사용한 회귀 모델의 RMSE가 0.0115, R2 값이 0.3903으로 향상되었습니다.