Greffe du poumon : 10 à 30% de décès un an après la transplantation
La greffe pulmonaire est l’opération de la dernière chance pour les personnes atteintes d’une pathologie respiratoire au stade terminal. Elle en sauve beaucoup, mais on compte selon les profils de patients 10 à 30% de décès dans l’année qui suit la transplantation. Parmi les causes de ces issues fatales : le rejet de greffe dit « aigu », qui doit être traité en urgence. Aussi, des biopsies préventives du nouveau poumon sont régulièrement pratiquées et soumises à l’œil expert d’un médecin anatomopathologiste, pour détecter les signes avant-coureurs de rejet.
Loïc Le Bescond et Aymen Sadraoui, doctorants de l’école CentraleSupélec* au sein de l’équipe-projet OPIS commune Inria et Université Paris-Saclay dans le laboratoire CVN, n’avaient jamais travaillé sur ce sujet avant juin 2024. Mais leurs thèses portaient sur un thème voisin : l’analyse de biopsies ou de pièces chirurgicales numérisées avec des outils d’intelligence artificielle. Pour Loïc, l’objectif était de diagnostiquer les cancers du sein et de comprendre les mécanismes d’action de nouveaux traitements ; pour Aymen, de diagnostiquer un type particulier de cancer du foie et de prédire le risque de récidive.
Data Challenge : vainqueurs devant 250 participants du monde entier
Verbatim
Nous avions une expertise en analyse de très grands volumes de données et d’images de haute complexité. Ce Data Challenge organisé par l’hôpital Foch reposait sur les mêmes fondamentaux avec l’objectif de proposer une IA d’aide au diagnostic, complémentaire de l’examen visuel des biopsies de poumons.
Doctorant de l’école CentraleSupélec au sein de l’équipe OPIS
Très suivie, la compétition a attiré plus de 250 scientifiques des données venus du monde entier. Elle s’est déroulée de juin à août 2024. « Nos vacances d’été ont été courtes » sourient les deux coéquipiers. Le jeu en valait la chandelle : le 14 août 2024 à 8h du matin, ils ont été déclarés vainqueurs.
« Notre algorithme d’apprentissage automatique a été jugé le plus précis et le plus robuste », indique Aymen. Un outil d’aide au diagnostic prometteur pour la santé des patients, mais qui nécessite encore des améliorations : « On ne l’utilisera pas demain dans les hôpitaux : en deux mois, on arrive tout juste à une preuve de concept, poursuit le chercheur. Mais il devrait faire l’objet d’études de terrain, pour le valider, l’affiner, et peut-être mettre au point une application clinique. »
Le défi : un volume de données inhabituel en intelligence artificielle
Véritable défi, le délai très court de deux mois a fait émerger des idées novatrices pour résoudre un problème qu’une thèse de trois ans n’aurait pas forcément suffi à adresser.
Verbatim
Nous avions beaucoup de pistes et peu de temps pour les explorer, raconte Loïc. Il a fallu être stratèges, et pas seulement scientifiques. Trois critères ont prévalu : miser sur un modèle d’apprentissage éprouvé, facile à implémenter et rapide à entraîner.
Doctorant de l’école CentraleSupélec au sein de l’équipe OPIS
Développer un tel modèle en deux mois était impensable. Les équipes ont donc recouru à des composants logiciels préexistants et disponibles en open source ; c’était une demande des organisateurs. Le choix était vaste ; chaque équipe a dû opérer sa sélection, combiner au mieux les composants retenus, concevoir des solutions pertinentes de prétraitement et de post-traitement des données, et gérer un volume de données très inhabituel dans les applications d’intelligence artificielle.
« Lors d’un essai clinique, nous analysons quelques centaines de lames numérisées, soit à peu près autant de gigaoctets de données ; c’est déjà beaucoup, illustre Aymen. Pour ce Data Challenge, nous avons reçu 4 000 lames numérisées comptant chacune 100 000 x 100 000 pixels. De plus, 2500 de ces lames étaient annotées par des experts pour nous indiquer les zones annonciatrices de rejets. Soit au total 4 téraoctets de données, dont la gestion et le stockage étaient déjà des défis en soi. »
Un parti-pris original pour prétraiter les données
Difficulté supplémentaire : ces zones d’intérêt avaient une taille dérisoire par rapport à celle de la lame complète. Bien que visibles, elles ne permettaient pas de poser directement un diagnostic. Un peu comme s’il fallait tirer des conclusions à partir de quelques aiguilles microscopiques dispersées dans une gigantesque meule de foin.
Les deux doctorants de l’équipe OPIS ont fait la différence en adoptant un parti-pris original. Plutôt que de considérer chaque lame dans sa globalité, comme il est d’usage pour ce type de tâche, ils les ont découpées en une multitude d’images plus petites, qu’ils regroupaient ensuite selon leurs dimensions et leur nature (annonciatrices ou non de rejets). Ainsi, les zones d’intérêt étaient plus faciles à localiser et l’analyse de la lame, plus fiable.
« L’équipe allemande qui a terminé à la deuxième place a fait le même choix, note Loïc. Preuve que le prétraitement des données était aussi déterminant que le modèle d’apprentissage lui-même. »
Le modèle : un réseau de neurones déjà pré-entraîné
Pour ce modèle, les deux doctorants ont retenu un réseau de neurones convolutifs. Ce type de réseau, conçu pour traiter et analyser des images, est inspiré par l’organisation du cortex visuel des animaux. Il identifie des caractéristiques comme les bords d’images horizontaux ou verticaux, les textures, les motifs récurrents, etc. Puis il en dégage les motifs les plus saillants pour prédire au mieux la solution.
Enfin, il s’appuie sur ces caractéristiques pour classifier les images. « Nous partions d’un réseau de neurones convolutifs développé pour la détection de tumeurs, qui les classait en quatre catégories selon leur nature, leur taille et leur gravité, détaille Aymen. Nous l’avons modifié pour n’en retenir que deux : existence ou absence d’un risque de rejet. »
Ce réseau de neurones (pré-entraîné) avait l’avantage d’avoir déjà été confronté à un très grand nombre de données similaires, ce qui facilitait son application à de multiples cas d’usage. Loïc et Aymen l’ont adapté aux spécificités des greffes pulmonaires, tout en conservant ses qualités intrinsèques. Après l’annonce des résultats mi-août, ils ont fourni leur code au jury qui a pu confirmer la validité de leur solution et leur première place au classement.
Un début de thèse sous les meilleurs hospices
Aujourd’hui en dernière année de thèse, l’un et l’autre sont confortés par ce succès dans la conviction qu’ils ont choisi la bonne voie. « Pour moi, combiner IA et applications de santé va de soi » confie Aymen. « Je ne me vois pas consacrer des années de travail à des sujets sans retombées utiles », complète Loïc.
Les deux chercheurs ignorent quand et comment l’hôpital Foch validera leur outil sur le terrain, mais gardent à l’esprit l’autre finalité des Data Challenges : se signaler comme des scientifiques de valeur auprès des organismes de recherche et des industriels qui recrutent. Pour eux, cette compétition victorieuse représente déjà l’amorce d’une nouvelle histoire.
*Ils réalisent leur thèse en collaboration avec l’institut Gustave Roussy (pour Loïc Le Bescond) et le laboratoire Bernoulli, commun à Inria et à AP-HP (pour Aymen Sadraoui).
En savoir plus
- Data Challenges en santé : découvrez les premiers résultats du Data Challenge DigiLut ! Health Data Hub, 2/10/2024.
- Greffe pulmonaire : prévenir la dysfonction du greffon, Esinum, 13/9/2019.
- Un avatar numérique des poumons, Polytechnique Insights, 27/4/2022.