Multivariate time series models are useful tools for understanding and predicting the interactions among multiple variables. Temporal clustering techniques further aid in analyzing such data by identifying sets of time series that exhibit similar trends over time. However, accurate modeling and clustering are essential for enhancing forecasting accuracy and anomaly detection. Financial time series data present unique challenges due to their characteristics such as volatility clustering, heavy tails, non-linearity, and non-normality. Moreover, computational challenges can arise due to the high-dimensionality of such data. In this thesis, we propose two key methodologies for modeling and clustering multivariate financial time series data, taking into account their characteristics. In Chapter 2, we first introduce the regime switching Student-t copula model, a powerful tool for capturing the heavy-tailed joint distribution of financial returns across different market conditions. This model combines the flexibility of the Student-t copula distribution with the ability to switch between market states. We propose a novel maximum likelihood estimation approach tailored for this model, addressing computational challenges associated with estimating copula models for multivariate data. We test the proposal through an extensive simulation study and we show that it provides good results in finite samples. We apply our approach to model the joint distribution of the five main cryptocurrency log-returns, demonstrating its effectiveness in tracking bull and bear market phases based on cryptocurrency correlations. In Chapter 3, we present the sparse statistical jump model, designed to address the challenges of high-dimensional financial data. This model allows for the identification of key drivers within a high dimensional set of candidate variables while modeling the hidden state sequence. The sparse statistical jump model is particularly advantageous, as it allows for simultaneous parameter estimation, feature selection, and state-sequence decoding. Our analysis includes over 400 variables encompassing cryptocurrency market network activity, market sentiment, and features from debt, equity, forex, and commodity markets. Notably, the model identifies momentum, crypto market sentiment, and trade activity as key features. Chapter 4 introduces the generalized information criteria framework extended to sparse statistical jump models. This framework facilitates the selection of optimal parameters for model complexity, state transitions, and dataset sparsity in high-dimensional setups. We present a novel information criterion tailored for sparse statistical jump models, and we validate the proposal through extensive simulation studies, demonstrating its feasibility and consistency in choosing the right model. Our contributions provide innovative solutions for modeling and clustering financial time series data, addressing their specific challenges and advancing the field of financial time series data analysis.

I modelli statistici per serie storiche multivariate sono strumenti utili per comprendere e prevedere le interazioni tra diverse variabili. Le tecniche di clustering temporale aiutano ulteriormente nell'analisi di tali dati, identificando insiemi di serie storiche con tendenze simili nel tempo. Tuttavia, una modellazione accurata è essenziale per migliorare l'accuratezza delle previsioni e la rilevazione delle anomalie. Le serie storiche finanziarie presentano sfide uniche dovute alle loro caratteristiche, come il volatility clustering, le code pesanti, la non linearità e la non normalità. Inoltre, possono sorgere sfide computazionali a causa dell'alta dimensionalità di tali dati. In questa tesi, vengono proposte due metodologie chiave per la modellazione e il clustering di serie storiche finanziarie multivariate. Nel Capitolo 2, si introduce il modello regime switching copula Student-t, un potente strumento per catturare la distribuzione con code pesanti dei rendimenti finanziari in diverse condizioni di mercato. Questo modello combina la flessibilità della distribuzione della copula Student-t con la capacità di cambiare tra stati del mercato. Si propone un nuovo approccio di stima basato su massima verosimiglianza, affrontando le sfide computazionali legate alla stima di tali modelli per dati multivariati. La proposta viene testata attraverso uno studio di simulazione, dimostrando che essa fornisce buoni risultati su campioni finiti. L'approccio proposto viene in seguito applicato per modellare la distribuzione congiunta dei log-rendimenti delle cinque principali criptovalute, dimostrandone l'efficacia nel tracciare le fasi di mercato rialzista e ribassista. Nel Capitolo 3 viene presentato il modello sparse statistical jump, progettato per affrontare le sfide dei dati finanziari ad alta dimensionalità. Esso consente di identificare le variabili chiave all'interno di un insieme ad alta dimensionalità, modellando contemporaneamente la sequenza di stati latenti. Questo modello è particolarmente vantaggioso, poiché consente la stima simultanea dei parametri, la selezione delle variabili e la decodifica della sequenza di stati. L'analisi empirica proposta include oltre 400 variabili relative ai mercati delle criptovalute. Il modello identifica il momentum, il sentiment del mercato delle criptovalute e l'attività di trading come variabili chiave. Il Capitolo 4 introduce il framework dei criteri di informazione generalizzati estesi ai modelli sparse statistical jump. Questo framework facilita la selezione dei parametri ottimali per la complessità del modello, le transizioni di stato e la sparsità dei dati in configurazioni ad alta dimensionalità. Viene presentato un nuovo criterio di informazione adattato ai modelli sparse statistical jump e la proposta viene convalidata attraverso ampi studi di simulazione, dimostrando la sua fattibilità e coerenza nella scelta del modello corretto. La presente tesi fornisce soluzioni innovative per la modellazione e il clustering di serie storiche finanziarie, affrontando le loro sfide specifiche e proponendo soluzioni innovative nel campo.

(2024). Statistical Modeling and Temporal Clustering of Multivariate Time-Series with Applications to Financial Data. (Tesi di dottorato, Università degli Studi di Milano-Bicocca, 2024).

Statistical Modeling and Temporal Clustering of Multivariate Time-Series with Applications to Financial Data

CORTESE, FEDERICO PASQUALE
2024

Abstract

Multivariate time series models are useful tools for understanding and predicting the interactions among multiple variables. Temporal clustering techniques further aid in analyzing such data by identifying sets of time series that exhibit similar trends over time. However, accurate modeling and clustering are essential for enhancing forecasting accuracy and anomaly detection. Financial time series data present unique challenges due to their characteristics such as volatility clustering, heavy tails, non-linearity, and non-normality. Moreover, computational challenges can arise due to the high-dimensionality of such data. In this thesis, we propose two key methodologies for modeling and clustering multivariate financial time series data, taking into account their characteristics. In Chapter 2, we first introduce the regime switching Student-t copula model, a powerful tool for capturing the heavy-tailed joint distribution of financial returns across different market conditions. This model combines the flexibility of the Student-t copula distribution with the ability to switch between market states. We propose a novel maximum likelihood estimation approach tailored for this model, addressing computational challenges associated with estimating copula models for multivariate data. We test the proposal through an extensive simulation study and we show that it provides good results in finite samples. We apply our approach to model the joint distribution of the five main cryptocurrency log-returns, demonstrating its effectiveness in tracking bull and bear market phases based on cryptocurrency correlations. In Chapter 3, we present the sparse statistical jump model, designed to address the challenges of high-dimensional financial data. This model allows for the identification of key drivers within a high dimensional set of candidate variables while modeling the hidden state sequence. The sparse statistical jump model is particularly advantageous, as it allows for simultaneous parameter estimation, feature selection, and state-sequence decoding. Our analysis includes over 400 variables encompassing cryptocurrency market network activity, market sentiment, and features from debt, equity, forex, and commodity markets. Notably, the model identifies momentum, crypto market sentiment, and trade activity as key features. Chapter 4 introduces the generalized information criteria framework extended to sparse statistical jump models. This framework facilitates the selection of optimal parameters for model complexity, state transitions, and dataset sparsity in high-dimensional setups. We present a novel information criterion tailored for sparse statistical jump models, and we validate the proposal through extensive simulation studies, demonstrating its feasibility and consistency in choosing the right model. Our contributions provide innovative solutions for modeling and clustering financial time series data, addressing their specific challenges and advancing the field of financial time series data analysis.
PELAGATTI, MATTEO MARIA
PENNONI, FULVIA
Clustering Temporale; Switching di Regime; Mercati Finanziari; Variabili Latenti; Modelli Multivariati
Temporal clustering; Regime Switching; Financial Markets; Latent Variables; Multivariate Models
SECS-S/01 - STATISTICA
English
16-feb-2024
35
2022/2023
open
(2024). Statistical Modeling and Temporal Clustering of Multivariate Time-Series with Applications to Financial Data. (Tesi di dottorato, Università degli Studi di Milano-Bicocca, 2024).
File in questo prodotto:
File Dimensione Formato  
phd_unimib_854287.pdf

accesso aperto

Descrizione: Tesi di Cortese Federico Pasquale 854287
Tipologia di allegato: Doctoral thesis
Dimensione 2.01 MB
Formato Adobe PDF
2.01 MB Adobe PDF Visualizza/Apri

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10281/460320
Citazioni
  • Scopus ND
  • ???jsp.display-item.citation.isi??? ND
Social impact