Sites Inria

English version

ANR

1/03/2018

ClinMine : analyser les parcours patients à l’hôpital

(CC0)

Durées d’hospitalisation, protocoles de soins, résultats d’examens, dossier de transmission entre médecins… Les hôpitaux français génèrent un nombre important de données. Savoir les traiter et les analyser pourraient permettre d’optimiser la prise en charge des patients. C’est précisément l’objet du projet ANR ClinMine, auquel ont participé, notamment, des membres de l’équipe-projet Modal1 du centre Inria Lille – Nord Europe.

« Dans un hôpital, le parcours d’un malade engendre une importante quantité de données complexes, explique Cristian Preda, Professeur à Polytech’Lille et porteur du projet ClinMine côté Inria. De plus en plus, les hôpitaux pensent qu’exploiter ces données de façon plus approfondie pourrait être intéressant. » C’est dans ce contexte que s’est créé le projet ClinMine, en janvier 2014, réunissant six partenaires d’horizons variés : hôpitaux, centres de recherche, entreprises... Soutenu par l’Agence nationale de recherche (ANR), ce programme de recherche visait alors à développer des méthodologies d’analyses statistiques des informations recueillies par les Programmes de médicalisation des systèmes d’information (PMSI) des hôpitaux, pour en dégager des typologies de parcours de soin. Les méthodes ont ensuite été appliquées dans le cadre d’études de cas, comme par exemple l’analyse des résistances à certaines bactéries.

Les chercheurs ont été confrontés à une difficulté : le parcours du patient à l’hôpital est, par définition, dynamique, ce qui complexifie le traitement les données de santé. « Aujourd’hui, en matière de statistique, nous savons plutôt bien analyser les données qui évoluent dans le temps, lorsqu’elles sont quantitatives. C’est le cas par exemple pour une courbe de température. À l’hôpital, le patient passe d’un service à l’autre, il y a un diagnostic différent, un acte médical différent... Tous ces paramètres qualitatifs évoluent dans le temps. Et c’est quelque chose qui n’est pas simple à traiter, et dont les méthodes de calculs sont relativement récentes » , précise Cristian Preda. 

Analyse des courriers de l’Institut Catholique de Lille

Au centre Inria de Lille, Modal est justement spécialisée dans le traitement des données complexes, que ce soit par leur taille ou leur structure. Au sein de cette équipe-projet, Cristian Preda analyse spécifiquement les questions de temporalité. Accompagné par quatre chercheurs, dont un un post-doctorant il s’est donc particulièrement penché sur cette question dans le cadre de ClinMine. Pour ce faire, ils ont travaillé sur une étude de cas, l’analyse de tous les courriers envoyés aux patients entre janvier 2012 et mai 2016 par le Groupe Hospitalier de l’Institut Catholique de Lille (GHICL).

« Nous avons commencé par un important travail de simulation, remarque le chercheur. Il s’agissait de valider nos calculs et le volume de données qu’ils pourraient traiter. » Ensuite, il a fallu appliquer ces méthodes aux données réelles. Une étape qui s’est révélée longue et compliquée. L’équipe s’est retrouvée avec 400 000 courriers de consultations et 600 000 courriers d’hospitalisations à extraire en données. Et beaucoup se sont avérées incomplètes ou fausses. « Il y avait de nombreuses incohérences. Nos outils techniques détectaient des paternes que ne nous ne pouvions pas interpréter. Or, pour l’analyse des données complexes il faut impérativement partir d’une matière fiable. » L’équipe a donc dû faire un grand travail de « nettoyage ». « Nous avons organisé plusieurs réunions avec les services informatiques de l’hôpital pour trouver des explications et des solutions à ces anomalies. Cette étape de préparation des données a représenté 50% de notre travail. Nous n’avions pas anticipé à ce point ce problème. Même si nous savons qu’en analyse de données réelles, le facteur surprise est toujours très importants. »

L’analyse des courriers a permis de dégager plusieurs typologies, dont certaines traduisaient un dysfonctionnement. Par exemple des courriers dont la rédaction a pris trop de temps, des délais de validation trop important ou encore des différences de traitement des courriers selon les services. In fine, ces données ont donc mis en évidence des problèmes au sein de l’hôpital que ce soit au niveau informatique ou en matière de ressources humaines. « Après notre analyse, l’hôpital va s’approprier les résultats pour expliquer ou comprendre les différents paternes identifiés », remarque Cristian Preda. 

Dans le cadre de cette étude de cas, l’équipe a conçu un logiciel libre de distribution. « Il pourrait par exemple être utilisé par d’autres statisticiens pour étudier des trajectoires d’évolution des paramètres qualitatifs dans divers contextes (santé publique, économie, etc.)»

ClinMine 2 ?

Après 42 mois de recherche, le projet ANR prendra fin en décembre prochain. Cristian Preda en tire un bilan positif : « D’un point de vue humain, c’est une réussite d’avoir pu réunir des informaticiens, des statisticiens et des hospitaliers au sein d’un même programme de recherche. D’un point de vue scientifique, nous avons réussi à développer des méthodes innovantes, qui ont été reconnues dans différentes publications.»

Mais l’équipe n’a pas l’intention de s’arrêter là. Plusieurs axes de recherches du projet n’ont en effet pas pu aboutir. « Nous n’avons notamment pas eu le temps d’analyser les données du CHU de Lille dans le temps imparti. » Pour cette étude de cas, les chercheurs espéraient trouver une méthode pour détecter un éventuel début de déficience cognitive en analysant l’historique médical des patients. En ligne de mire : trouver des facteurs prédictifs de déclenchement de la maladie d’Alzheimer. « C’est un sujet qui intéresse beaucoup de monde. Et maintenant que nous avons les données, nous pensons que ce serait une bonne idée de poursuivre le travail au sein de ClinMine 2 »

Partenaires du projet

Six partenaires sont associés au projet coordonné par le laboratoire CRIStAL de l’Université de Lille : l’entreprise Alicante, l’Equipe d'Accueil (EA) 2694 "Santé Publique : épidémiologie et qualité des soins", le Groupe Hospitalier de l'Institut Catholique de Lille (GHICL), l’EA 1046 « Maladie d’Alzheimer et pathologies vasculaires », le LIFL Laboratoire d'Informatique de Lille, et le centre de recherche Inria Lille – Nord Europe.

1L'équipe-projet Modal est commune avec le CNRS, l'Université de Lille − sciences et technologies et l'Université de Lille − droit et santé. Au sein de l'UMR 8524 CNRS-Université de Lille − sciences et technologies, Laboratoire Paul Painlevé, et de l'EA 2694 "Santé Publique : épidémiologie et qualité des soins" de l'Université de Lille − droit et santé.

Mots-clés : ClinMine Parcours patients Hopital ANR Données Santé Équipe-projet Modal Data

Haut de page

Suivez Inria tout au long de son 50e anniversaire et au-delà !