The aim of this thesis is to explore innovative methods in Bayesian nonparametrics (BNP) for modeling observations in the context of survival analysis. To achieve this, the goal is to leverage the flexibility of BNP methods to address some issues present in the literature on this subject, while also considering the practical implementability of the proposed models to ensure they are applicable in real-case scenarios. This manuscript is a collection of two projects, each of which explores different BNP tools to address two distinct problems in survival analysis. The manuscript is organized around two distinct research questions. In particular, in Chapter 2, we focus on the study of survival datasets in contexts where it is reasonable to assume a strictly positive probability of recovery, called cure rate. Such datasets are usually modeled using the so-called cure rate models, for which various examples exist in both the frequentist and Bayesian literature. We align ourselves with the BNP framework by proposing the use of a class of processes typically employed in feature sampling problems, called stable-beta scaled processes, which prove to be particularly suitable for survival analysis. We will demonstrate how they are interesting both in terms of theoretical properties and applicability in real-case scenarios. Chapter 3, on the other hand, focuses on datasets consisting of different groups of survival times, raising the question of whether it is more advantageous to model each group of observations independently each others or if it is more reasonable to use a single model that estimates the survival of each group simultaneously. We adopt the latter approach, introducing a novel BNP hierarchical model that accounts for the survival of each group of observations while considering potential correlations between them. This approach allows the estimation of each group to improve the estimation of all others, following the principle of borrowing of information, which is well-known in the BNP literature. In summary, this thesis aims to provide two examples of how BNP methods allow addressing research questions using similar sets of theoretical tools, highlighting their potential in terms of depth and flexibility.

L'obiettivo di questa tesi è quello di esplorare metodi innovativi nell'ambito della statistica Bayesiana nonparametrica (BNP) per modellare osservazioni nel contesto dell'analisi della sopravvivenza. Per raggiungere questo scopo, l'intento è di sfruttare la flessibilità dei metodi BNP per affrontare alcune problematiche presenti in letteratura su questo argomento, considerando al contempo la fattibilità pratica dei modelli proposti, in modo da garantirne l'applicabilità in scenari reali. Questa tesi è una raccolta di due progetti, ciascuno dei quali esplora diversi strumenti BNP per affrontare due problemi distinti in analisi della sopravvivenza. La tesi è strutturato attorno a due domande di ricerca distinte. In particolare, nel Capitolo 2 ci concentriamo sullo studio di dataset di tempi di sopravvivenza in contesti in cui è ragionevole assumere una probabilità strettamente positiva di guarigione, nota come cure rate. Questi dataset sono solitamente modellati utilizzando i cosiddetti modelli di cure rate, per i quali esistono vari esempi sia nella letteratura frequentista che in quella Bayesiana. Noi ci collochiamo nel filone della BNP, proponendo l'uso di una classe di processi tipicamente impiegati nei problemi di feature sampling, chiamati processi stable-beta scaled, che si rivelano particolarmente adatti in analisi della sopravvivenza. Dimostriamo come essi siano interessanti sia in termini di proprietà teoriche sia di applicabilità in scenari reali. Il Capitolo 3, invece, si concentra su dataset costituiti da diversi gruppi di tempi di sopravvivenza, ponendo la questione se sia più vantaggioso modellare ciascun gruppo di osservazioni indipendentemente dagli altri, oppure se sia più ragionevole utilizzare un unico modello che stimi simultaneamente la sopravvivenza di ciascun gruppo. Adottiamo quest'ultima strategia, introducendo un nuovo modello BNP gerarchico che tiene conto della sopravvivenza di ciascun gruppo di osservazioni, considerando anche le potenziali correlazioni tra di essi. Questo approccio consente di migliorare la stima di ciascun gruppo attraverso il principio del borrowing of information, ben noto nella letteratura BNP. In sintesi, questa tesi mira a fornire due esempi di come i metodi BNP permettano di affrontare domande di ricerca utilizzando insiemi simili di strumenti teorici, evidenziandone il potenziale in termini di profondità e flessibilità.

(2025). Bayesian nonparametric models for survival analysis. (Tesi di dottorato, , 2025).

Bayesian nonparametric models for survival analysis

COGO, RICCARDO
2025

Abstract

The aim of this thesis is to explore innovative methods in Bayesian nonparametrics (BNP) for modeling observations in the context of survival analysis. To achieve this, the goal is to leverage the flexibility of BNP methods to address some issues present in the literature on this subject, while also considering the practical implementability of the proposed models to ensure they are applicable in real-case scenarios. This manuscript is a collection of two projects, each of which explores different BNP tools to address two distinct problems in survival analysis. The manuscript is organized around two distinct research questions. In particular, in Chapter 2, we focus on the study of survival datasets in contexts where it is reasonable to assume a strictly positive probability of recovery, called cure rate. Such datasets are usually modeled using the so-called cure rate models, for which various examples exist in both the frequentist and Bayesian literature. We align ourselves with the BNP framework by proposing the use of a class of processes typically employed in feature sampling problems, called stable-beta scaled processes, which prove to be particularly suitable for survival analysis. We will demonstrate how they are interesting both in terms of theoretical properties and applicability in real-case scenarios. Chapter 3, on the other hand, focuses on datasets consisting of different groups of survival times, raising the question of whether it is more advantageous to model each group of observations independently each others or if it is more reasonable to use a single model that estimates the survival of each group simultaneously. We adopt the latter approach, introducing a novel BNP hierarchical model that accounts for the survival of each group of observations while considering potential correlations between them. This approach allows the estimation of each group to improve the estimation of all others, following the principle of borrowing of information, which is well-known in the BNP literature. In summary, this thesis aims to provide two examples of how BNP methods allow addressing research questions using similar sets of theoretical tools, highlighting their potential in terms of depth and flexibility.
PELAGATTI, MATTEO MARIA
CAMERLENGHI, FEDERICO
BNP; Sopravvivenza; Modelli gerarchici; Tasso di cura; NTR
BNP; Survival; Hierarchical models; Cure rate; NTR
Settore STAT-01/A - Statistica
English
13-feb-2025
36
2023/2024
open
(2025). Bayesian nonparametric models for survival analysis. (Tesi di dottorato, , 2025).
File in questo prodotto:
File Dimensione Formato  
phd_unimib_868839.pdf

accesso aperto

Descrizione: Bayesian nonparametric models for survival analysis ​
Tipologia di allegato: Doctoral thesis
Dimensione 2.37 MB
Formato Adobe PDF
2.37 MB Adobe PDF Visualizza/Apri

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10281/542941
Citazioni
  • Scopus ND
  • ???jsp.display-item.citation.isi??? ND
Social impact