Generative Adversarial Networks for Synthetic Data Generation in Finance: Evaluating Statistical Similarities and Quality Assessment

Faisal Ramzan,Sergio Consoli,Claudio Sartori,Diego Reforgiato Recupero

doi:10.3390/ai5020035

Abstract

Generating synthetic data is a complex task that necessitates accurately replicating the statistical and mathematical properties of the original data elements. In sectors such as finance, utilizing and disseminating real data for research or model development can pose substantial privacy risks owing to the inclusion of sensitive information. Additionally, authentic data may be scarce, particularly in specialized domains where acquiring ample, varied, and high-quality data is difficult or costly. This scarcity or limited data availability can limit the training and testing of machine-learning models. In this paper, we address this challenge. In particular, our task is to synthesize a dataset with similar properties to an input dataset about the stock market. The input dataset is anonymized and consists of very few columns and rows, contains many inconsistencies, such as missing rows and duplicates, and its values are not normalized, scaled, or balanced. We explore the utilization of generative adversarial networks, a deep-learning technique, to generate synthetic data and evaluate its quality compared to the input stock dataset. Our innovation involves generating artificial datasets that mimic the statistical properties of the input elements without revealing complete information. For example, synthetic datasets can capture the distribution of stock prices, trading volumes, and market trends observed in the original dataset. The generated datasets cover a wider range of scenarios and variations, enabling researchers and practitioners to explore different market conditions and investment strategies. This diversity can enhance the robustness and generalization of machine-learning models. We evaluate our synthetic data in terms of the mean, similarities, and correlations.

Talk to us

Join us for a 30 min session where you can share your feedback and ask us any queries you have

Schedule a call

R Discovery Prime

R Discovery Prime

Generative Adversarial Networks for Synthetic Data Generation in Finance: Evaluating Statistical Similarities and Quality Assessment

Abstract

Talk to us

Similar Papers

More From: AI

Lead the way for us

Journal: AI	Publication Date: May 13, 2024
License type: CC BY 4.0

Similar Papers

Synthetic Data Generation By Artificial Intelligence to Accelerate Translational Research and Precision Medicine in Hematological Malignancies
Saverio D'Amico ...
Blood | VOL. 140
Saverio D'Amico, et. al.Saverio D'Amico ...
15 Nov 2022
Blood | VOL. 140

GLSTM: A novel approach for prediction of real & synthetic PID diabetes data using GANs and LSTM classification model
Priyanka Gupta ... Sushma Jaiswal
International Journal of Experimental Research and Review | VOL. 30
Priyanka Gupta, et. al.Priyanka Gupta ... Sushma Jaiswal
30 Apr 2023
International Journal of Experimental Research and Review | VOL. 30

An evaluation of the replicability of analyses using synthetic health data
Khaled El Emam ... Alaa El-Hussuna
Scientific Reports | VOL. 14
Khaled El Emam, et. al.Khaled El Emam ... Alaa El-Hussuna
24 Mar 2024
Scientific Reports | VOL. 14

Impacts of Data Synthesis: A Metric for Quantifiable Data Standards and Performances
Gunjan Chandra ... Riitta Veijola
Data | VOL. 7
Gunjan Chandra, et. al.Gunjan Chandra ... Riitta Veijola
11 Dec 2022
Data | VOL. 7

Editage

Paperpal

R Discovery

Mind the Graph

R Discovery Prime

R Discovery Prime

Generative Adversarial Networks for Synthetic Data Generation in Finance: Evaluating Statistical Similarities and Quality Assessment

Abstract

Talk to us

Similar Papers

More From: AI