Datavers mise sur l’interdisciplinarité au service du parcours patient
Date:
Mis à jour le 16/10/2025
Datavers est une nouvelle équipe-projet du Centre Inria de l’Université de Lille, commune avec l'Université de Lille et, pour la première fois, le CHU de Lille. Créée le 1er août 2025, elle est le résultat d’un projet mûri de longue date : « Nous avons commencé à réfléchir dès 2020 à la thématique vers laquelle nous souhaitions nous orienter puisque l’équipe Modal, à laquelle je participais, vivait ses dernières années, retrace Cristian Preda, responsable de Datavers. Comme je m’intéresse au traitement statistique des données qui évoluent dans le temps, et que par ailleurs, j’ai travaillé un moment au sein de la faculté de médecine de Lille, j’ai proposé que nous nous consacrions aux applications en santé et au parcours patient en particulier. »
L’idée fédère, mais rapidement, les scientifiques d’Inria ressentent le besoin d’une équipe interdisciplinaire. « Nous ne souhaitions pas rester entre mathématiciens, poursuit Cristian Preda. Le projet avait beaucoup plus de sens selon nous s’il intégrait des professionnels hospitaliers. » Alors en 2021, pour tester d’éventuelles synergies en amont de la création de l’équipe, Modal (commune à Inria et au laboratoire Paul Painlevé, du CNRS) met sur pied une action exploratoire, baptisée Path (PArcours paTient en milieu Hospitalier), à laquelle participe également l’équipe METRICS (Université de Lille), qui réunit des cliniciens et des méthodologistes en ergonomie, biostatistiques, informatique médicale, sciences de la donnée et économie de la santé.
Le projet s’appuie notamment sur la cohorte DAMAGE, qui rassemble près de 3000 personnes âgées et est étudiée par l’équipe de recherche en gériatrie du CHU de Lille, dirigée par les professeurs Puisieux et Beuscart. L’objectif : analyser le parcours de ces patientes et patients pendant l’année suivant leur passage dans l’unité de gériatrie.
Image
Verbatim
Au départ, il n’était pas évident de travailler tous ensemble, car certains résultats statistiques peuvent avoir une portée pour le mathématicien mais pas pour le médecin.
Auteur
Poste
Chercheur, responsable de l'équipe-projet Datavers
« Mais nous avons finalement réussi à identifier neuf profils ayant du sens d’un point de vue clinique. Nous préparons actuellement une publication démontrant l’intérêt de ces données », note Cristian Preda.
Surtout, cette première collaboration a prouvé que l’interdisciplinarité ouvrait la porte à de nouvelles applications de l'apprentissage statistique… et a donc mis en avant la pertinence d’une équipe basée sur ce modèle. Parmi la douzaine de scientifiques impliqués dans l’action exploratoire Path, six intègrent ainsi la future équipe Datavers : deux viennent du laboratoire Painlevé, un d’Inria et trois de l’équipe Metrics. Parmi ceux-ci figure Emmanuel Chazard, professeur des universités-praticien hospitalier (PU-PH) et docteur en santé publique : « Nous disposons d’importants volumes de données issues directement des soins des patients, relève-t-il. Celles-ci sont beaucoup plus complexes que celles habituellement utilisées par les mathématiciens pour établir des outils statistiques, notamment parce qu’elles évoluent dans le temps et ne sont pas uniquement quantitatives. Il nous faut donc des méthodes à la hauteur de cette complexité, et c’est tout l’intérêt de travailler avec des mathématiciens sur les données de la vie réelle. »
Les scientifiques de l’équipe vont donc unir leurs expertises autour de trois axes. Le premier : faire avancer la recherche fondamentale sur l’utilisation de données complexes en adaptant les méthodes d’apprentissage statistique, supervisées ou non. « L’hôpital fournit une source de données très hétérogènes, sous forme de signaux, de chiffres, d’états…, détaille Cristian Preda. Nous allons donc utiliser à la fois des méthodes de clustering, pour identifier des groupes de données aux caractéristiques communes, mais aussi des modèles de régression pour expliquer des résultats cliniques, comme la mortalité, la qualité de vie, le risque de réhospitalisation, etc. »
Quant au deuxième axe, il vise à prendre en compte la dimension temporelle de ces données hétérogènes, ce qui en augmente encore la difficulté de traitement. Évidemment, ces deux axes ne peuvent pas être étudiés l’un sans l’autre et seront donc étroitement imbriqués. Enfin, le troisième objectif de l’équipe est de décliner l’ensemble de ces recherches fondamentales au service du parcours patient, avec une ambition : proposer des modèles de systèmes d’aide à la décision.
Par exemple, les scientifiques vont travailler avec le professeur François Pattou, du CHU de Lille, sur le suivi des patients après une chirurgie bariatrique afin d’identifier, grâce à l’apprentissage statistique, les mécanismes qui gouvernent les réhospitalisations, la mortalité ou d’autres événements.
Ils vont également essayer, dans le cadre du CDP (Cross-disciplinary project) NuMetaB, porté par les professeurs François Pattou et Guillemette Marot, d’évaluer l’impact des données en « omique » (génomique, protéomique…) sur la mortalité et les hospitalisations dans le cadre de l’obésité et du diabète. « D’une manière générale, les hôpitaux sont très intéressés pour pouvoir prédire au bout de combien de temps un patient risque la réhospitalisation, afin de gérer au mieux les entrées et sorties », précise Cristian Preda.
Emmanuel Chazard, envisage d’autres applications encore : « Il existe aujourd’hui des logiciels capables d’émettre des alertes sur les effets indésirables lors de la prescription médicamenteuse, mais ils sont si peu précis et leurs alertes sont donc si nombreuses que personne n’y prête plus attention. »
Image
Verbatim
En nous basant sur des outils statistiques efficaces, nous pourrions prédire des probabilités d’effets indésirables beaucoup plus pertinentes.
Auteur
Poste
Professeur des universités - praticien hospitalier, membre de Datavers
À plus long terme, il serait même envisageable, grâce aux nouvelles méthodes statistiques que l’équipe souhaite mettre au point, d’imaginer un changement de paradigme dans le soin : des analyses permanentes des bases de données patients pourraient prédire les probabilités de telle ou telle pathologie et permettre aux soignantes et soignants de contacter les patientes et patients avant l’apparition des problèmes.
Ce challenge scientifique s’accompagne d’un autre obstacle, d’ordre légal cette fois : celui de la confidentialité des données patients. En effet, si celles-ci peuvent être exploitables dans le cadre d’appels à projets particuliers, les cliniciens ne peuvent transmettre telles quelles leurs informations de cohorte aux scientifiques pour leurs études. « Obtenir l’accord de chaque patient est impensable, donc nous allons opter pour une autre solution : la mise au point de nos outils d’apprentissage statistique se fera en se basant sur des données synthétiques », révèle Cristian Preda.
Des algorithmes seront donc chargés de créer des jeux de données ressemblant aux données réelles. Mais encore faudra-t-il s’assurer qu’elles soient effectivement assez proches de la réalité pour que les méthodes testées à leur niveau puissent bien s’appliquer aux cas concrets ensuite. Et c’est là un autre sujet d’études pour Datavers.
Pour avancer sur ces différents points, Cristian Preda compte sur les appels à projets : « Notre interdisciplinarité nous permettra d’y répondre et d’obtenir les fonds dont nous avons besoin pour recruter des doctorantes et doctorants, qui seront le moteur de notre équipe. » Datavers est en ordre de marche pour faire avancer les prédictions du parcours patient.