この論文は、合成データの使用に伴う2つの主要なリスクについて説明しています。
第1のリスクは、データの多様性と代表性を偽装するリスクです。著者は、顔認識技術の評価に合成データを使用した実例を示し、合成データを使用してデータセットの多様性を高めようとしても、実際には表面的な多様性しか実現できず、潜在的な偏りを隠蔽してしまう可能性があることを指摘しています。
第2のリスクは、データ使用に対する同意を回避するリスクです。著者は、連邦取引委員会(FTC)による不公正・詐欺的な慣行に対する執行の枠組みを説明し、合成データの使用がこの枠組みを複雑化させ、データ主体の同意を回避する可能性があることを示しています。
これらのリスクは、合成データの使用が、データ作成者の手に権力を集中させ、データと被影響者を切り離すことで、アルゴリズムによる害悪に対する責任を曖昧にする例示だと指摘しています。今後の研究では、合成データの広範な使用状況を調査し、その危険性を軽減しつつ、参加型の権限強化を可能にする方法を検討する必要があります。
In eine andere Sprache
aus dem Quellinhalt
arxiv.org
Wichtige Erkenntnisse aus
by Cedric Desla... um arxiv.org 05-06-2024
https://arxiv.org/pdf/2405.01820.pdfTiefere Fragen