| Mots clés |
Analyse de survie, Données longitudinales, Équation différentielle contrôlée par réseau neuronal, Modèle conjoint, Prédiction de l'attrition, Signature, Statistiques à haute dimension |
| Resumé |
La disponibilité croissante des données longitudinales offre des opportunités significatives pour améliorer les modèles de survie en permettant des mises à jour dynamiques des évaluations des risques au fil du temps. Cependant, l'intégration de ces données dans les modèles de survie reste limitée en raison de la complexité des données longitudinales, des défis computationnels posés par les ensembles de données de haute dimension, et des difficultés d'interprétation. Cette limitation crée un écart crucial dans le domaine, restreignant la capacité à faire des prédictions précises et en temps réel dans des situations où les facteurs de risque évoluent au fil du temps. Cette thèse vise à combler cet écart en développant de nouveaux cadres d'analyse de survie qui intègrent efficacement les données de survie censurées aux côtés des données longitudinales multivariées. Le premier cadre propose un nouveau modèle conjoint dont une caractéristique clé est l'utilisation de caractéristiques génériques extraites des données longitudinales directement dans le modèle de survie. En outre, ces caractéristiques génériques sont indépendantes des hypothèses du modèle longitudinal, ce qui les rend adaptées aux marqueurs longitudinaux de haute dimension. Le second cadre s'appuie sur les récentes avancées en apprentissage profond et en équations différentielles pour apprendre des états latents guidés par les données, qui sont ensuite utilisés pour modéliser la fonction d'intensité des processus de comptage. Ces méthodes proposées démontrent de solides performances prédictives dans des expériences d'analyse de survie en temps réel et sont conçues pour être à la fois évolutives pour les problèmes de haute dimension. L'application pratique de ces cadres est illustrée par leur utilisation dans la prédiction de l'attrition chez Califrais. En intégrant efficacement les données de commandes des clients, ces modèles fournissent des prédictions plus précises du risque d'attrition, permettant ainsi aux entreprises de prendre des mesures proactives pour fidéliser leurs clients. Cette recherche contribue au domaine en fournissant des outils avancés pour l'analyse de survie et établit une base pour de futurs développements visant à intégrer pleinement les données longitudinales dans les modèles de survie dans divers domaines appliqués. |