Der Artikel beginnt mit einer Einführung in synthetische Daten und deren Generierung. Es werden verschiedene Techniken wie Simulationsmodelle, generative adversarische Netzwerke und Diffusionsmodelle vorgestellt. Anschließend wird die Bedeutung von Datenschutz im Finanzsektor diskutiert und ein Rahmenwerk mit sechs Datenschutzebenen präsentiert.
Der Hauptteil des Artikels behandelt dann konkrete Anwendungen synthetischer Daten in verschiedenen Modalitäten:
Tabellendaten: Es werden Methoden zur Generierung hochqualitativer synthetischer Tabellendaten vorgestellt, die für Anwendungen wie Betrugsbekämpfung eingesetzt werden können. Dabei wird auch auf Aspekte wie Datenschutz, Fairness und Robustheit eingegangen.
Ereignissequenzen: Synthetische Daten werden genutzt, um Kundenreisen und Multi-Touch-Attribution zu modellieren.
Zeitreihen: Synthetische Zeitreihendaten finden Anwendung in der Generierung, Imputation und Erstellung von Gegenszenarien.
Unstrukturierte Daten: Synthetische Bilder und Texte werden für Anwendungen wie Scheckverarbeitung und Dokumentenverständnis verwendet.
Der Artikel schließt mit einem Ausblick auf offene Forschungsfragen im Bereich synthetischer Daten im Finanzsektor.
Til et andet sprog
fra kildeindhold
arxiv.org
Vigtigste indsigter udtrukket fra
by Vams... kl. arxiv.org 03-22-2024
https://arxiv.org/pdf/2401.00081.pdfDybere Forespørgsler