Mots clés |
SNDS, PMSI, Pronostique, Modélisation, Parcours de soins, Tarification, Machine learning, Forêt aléatoire, Diabéte, Pathologie liées à l'âge |
Resumé |
Les décisions politiques se sont récemment traduites par une volonté de mieux définir les parcours de soins, notamment dans les pathologies chroniques, et d'évaluer ces parcours en vue d'une tarification forfaitaire dite « au parcours » ou « à l'épisode » de soins à l'instar de la tarification à l'activité des établissements de santé. L'enjeu principal consiste donc à adapter les modalités de financement du système de santé au contexte dans lequel les soins sont proposés. Dans le cadre d'une tarification forfaitaire, la qualité de prédiction des coûts en fonction des caractéristiques du patient et du parcours « prévu » est essentielle pour ne pas faire porter un risque financier trop important aux professionnels chargés d'assurer la prise en charge des patients. En effet, ces modèles de financement sont basés sur un partage du risque entre le payeur et les professionnels de santé et il s'agit d'optimiser les ressources tout en évitant une sélection des patients sur la base d'un risque trop élevé. Ainsi, la garantie d'un modèle tarifaire optimum repose sur la bonne évaluation des risques individuels pour l'approche choisie de tarification. En France, la base de données nationale du SNDS regroupe les données médico-administratives de l'Assurance Maladie, intégrant les données de consommations de villes, les données hospitalières, et la mortalité, permettant un suivi individuel longitudinal sur plusieurs années. En ce sens, l'utilisation des données médico-administratives est un atout considérable pour pouvoir mettre œuvre en routine des modèles prédictifs fondés sur des données structurées et fiables. L'objectif de cette thèse était de développer des outils statistiques en vue d'être utilisés pour la tarification des forfaits de soins. Ayant recours essentiellement aux données du SNDS, nous proposons d'aborder des problématiques intégrant pour chacune d'elle une comparaison de différentes approches prédictives (modèles de régression, forêts aléatoires, réseaux de neurones), au travers 1/ l'identification des patients associer un surrisque de coûts de santé dans la population générale, 2/ l'identification des patients à risque d'événement aigüe et grave dans la population vivant avec le diabète, et 3/ l'évolution de la prise en charge pour les pathologies liées à l'âge. |