Der Artikel beginnt mit einer Einführung in synthetische Daten und deren Generierung. Es werden verschiedene Techniken wie Simulationsmodelle, generative adversarische Netzwerke und Diffusionsmodelle vorgestellt. Anschließend wird die Bedeutung von Datenschutz im Finanzsektor diskutiert und ein Rahmenwerk mit sechs Datenschutzebenen präsentiert.
Der Hauptteil des Artikels behandelt dann konkrete Anwendungen synthetischer Daten in verschiedenen Modalitäten:
Tabellendaten: Es werden Methoden zur Generierung hochqualitativer synthetischer Tabellendaten vorgestellt, die für Anwendungen wie Betrugsbekämpfung eingesetzt werden können. Dabei wird auch auf Aspekte wie Datenschutz, Fairness und Robustheit eingegangen.
Ereignissequenzen: Synthetische Daten werden genutzt, um Kundenreisen und Multi-Touch-Attribution zu modellieren.
Zeitreihen: Synthetische Zeitreihendaten finden Anwendung in der Generierung, Imputation und Erstellung von Gegenszenarien.
Unstrukturierte Daten: Synthetische Bilder und Texte werden für Anwendungen wie Scheckverarbeitung und Dokumentenverständnis verwendet.
Der Artikel schließt mit einem Ausblick auf offene Forschungsfragen im Bereich synthetischer Daten im Finanzsektor.
Sang ngôn ngữ khác
từ nội dung nguồn
arxiv.org
Thông tin chi tiết chính được chắt lọc từ
by Vams... lúc arxiv.org 03-22-2024
https://arxiv.org/pdf/2401.00081.pdfYêu cầu sâu hơn