Science des données

Paul Boniol, le chasseur d’anomalies des séries temporelles

Date:
Mis à jour le 06/12/2023
Docteur en science des données, Paul Boniol a rejoint le Centre Inria de Paris en 2023 au sein de l’équipe-projet commune VALDA (pour Value from data) dans laquelle il poursuit ses travaux sur l’analyse des séries temporelles et la détection des anomalies. Des recherches théoriques que le jeune chercheur nourrit de ses rencontres avec d’autres disciplines.
Paul Boniol

Un parcours construit pas à pas

En ayant grandi à Toulouse, berceau d’Airbus et siège du CNES (Centre national d’études spatiales), Paul Boniol aurait pu choisir une carrière d’ingénieur aéronautique, secteur qui le passionnait dans sa jeunesse. Mais après ses classes préparatoires scientifiques, les concours d’entrée dans les grandes écoles en ont décidé autrement : « J’ai été reçu à l’ENSIMAG de Grenoble. C’est là que j’ai découvert l’informatique, notamment l’informatique théorique » raconte le jeune chercheur de 29 ans.

Le parcours de Paul s’est ainsi construit pas à pas, au fil des rencontres, des projets de recherche et des expériences de terrain. C’est son année Erasmus, en 2016-2017, qui lui donne le goût de la recherche scientifique dès ses premiers mois à la School of Computer Science and Statistics du Trinity College de Dublin. Autre étape importante, la rencontre avec son directeur de recherche Themis Palpanas, à l’occasion d’un stage de recherche au sein du laboratoire LIPADE de l’Université Paris Cité en 2017. Ensemble, ils déterminent son sujet de thèse : la détection des anomalies à travers l’analyse de séries temporelles.

Qu'est-ce qu'une série temporelle ?

Infographie expliquant ce qu'est une série temporelle.

 

Une "série temporelle" est une valeur qui évolue sur l'axe du temps, par exemple, une courbe de température mesurée sur plusieurs années. Comment identifier de manière précoce, précise et rapide des symptômes qui pourraient anticiper de futures anomalies dans un système avant qu'elles ne surviennent ? Comment être capable de donner, à l'échelle de la seconde, une telle prédiction qui fait sens ? Les travaux de Paul sont centrés sur cette problématique : automatiser l’analyse de ces grands volumes de données grâce au développement d’algorithmes permettant de mieux anticiper – et mieux comprendre – le moment où une centrale, une éolienne ou un barrage est susceptible de tomber en panne pour intervenir plus en amont. (Image tirée de la vidéo « Des algorithmes prédictifs » - Université Paris Cité).

Détection des anomalies : de la recherche théorique aux applications pratiques

Pendant trois ans (2019-2021), le doctorant travaille sur des nouvelles méthodes d’apprentissage non supervisées pour la création d’algorithmes capables de détecter rapidement des anomalies dans de grands ensembles de données. Si pour le grand public le mot data rime avec réseaux sociaux, web et confidentialité, cette recherche théorique débouche en réalité sur bien d’autres applications dont certaines intéressent l’entreprise EDF avec laquelle Paul a réalisé sa thèse dans le cadre du dispositif Cifre (Conventions industrielles de formation par la recherche).

Représentation de grandes collections de séries temporelles en graphe.
Représentation des grandes collections de séries temporelles en graphes pour faciliter l'extraction de connaissances dans de grands ensembles de données.

Une thèse financée par une entreprise ? Pour Paul Boniol, l’expérience a été passionnante : « EDF travaille avec près de 1 500 personnes en R&D dont 160 doctorants. Le cadre n’était donc pas si différent d’un laboratoire de recherche traditionnel et j’ai pu entrer en contact avec des personnes qui sont dans l’application, dans la pratique. » Durant son doctorat, il travaille par exemple avec les données des capteurs de centrales de production d’énergie électrique (barrages hydrauliques, éoliennes, centrales nucléaires) pour identifier des anomalies afin d’optimiser la maintenance des installations. Un travail qui a débouché sur le dépôt de deux brevets (un national et un européen).

S’il est certes chercheur en sciences théoriques, Paul aime aussi tisser des liens avec la pratique. Rien d’étonnant, donc, à ce qu’il ait travaillé en postdoctorat sur les éruptions volcaniques en collaboration avec l’IPGP (Institut de physique du Globe de Paris), ou comme chercheur invité à l’Observatoire européen des ondes gravitationnelles.

 

Illustration d'une détection supervisée de symptômes d'anomalies dans une centrale nucléaire.
Détection supervisée de symptômes d'anomalies dans une centrale nucléaire : Tâche de détection supervisée des précurseurs d'anomalies illustrée à l'aide d'un cas d'utilisation de centrale nucléaire, dans lequel (a) illustre les séries de données de capteurs provenant des sous-systèmes d'une centrale électrique donnée (b). L'objectif est de trouver, à partir des sous-séquences anormales connues dans la série de données des capteurs (illustrées par le rectangle rouge), les précurseurs potentiels de cette anomalie (illustrés par les rectangles rouge clair). https://theses.hal.science/tel-04028978.

Une nouvelle recrue pour l’équipe-projet VALDA

 

« Les idées ne me viennent pas en étant assis dans mon canapé, mais beaucoup par l’échange avec les autres. » Ce dialogue constructif, Paul Boniol entend bien le poursuivre en rejoignant l’équipe-projet commune VALDA (Inria, ENS-PSL et CNRS). Il apporte ainsi l’analyse temporelle aux recherches sur l’extraction de grandes quantités de données menées au sein de cette équipe. Devenir chercheur permanent au sein d’Inria offre au jeune chercheur du temps et des moyens pour mener sereinement ses travaux, dans une institution « à l’historique impressionnant dans le monde de la recherche ».

Dessin réalisé par Paul Boniol pour illustrer, dans sa thèse, la recherche de précurseurs d'anomalies : un robot coche les anomalies qu'il détecte dans des séries temporelles.
Dessin réalisé par Paul Boniol pour illustrer, dans sa thèse, la recherche de précurseurs d'anomalies. Son travail portait sur des nouvelles méthodes d’apprentissage non supervisées pour développer des algorithmes capables de détecter rapidement des anomalies dans de grands ensembles de données. Crédit : Paul Boniol/Inria.

« Il faut oser ! »

Ses prix de thèse ont-ils joué un rôle dans son recrutement à Inria ? « Ce qui est certain c’est que cela m’a donné de la visibilité, des opportunités de présenter mes recherches et de rencontrer d’autres chercheurs ». Autre certitude du chercheur : il ne faut pas s’autocensurer, car on est souvent piètre juge de ses propres travaux. « La confiance en moi, c’est encore un travail en cours. Mais il faut oser, se lancer, proposer des articles, faire confiance à ceux qui pensent qu’on peut se présenter à un prix. » recommande-t-il. Et qui sait ? Peut-être qu’un jour, c’est un ouvrage de Paul Boniol que l'on trouvera en livre de chevet des jeunes chercheurs en informatique, comme lui a lu et relu les Nonlinear Time Series Analysis de Kantz et Schrieber.

VALDA : extraire de la valeur à partir des données

Commune à Inria, l’École normale supérieure de Paris (ENS-PSL) et le CNRS, l’équipe-projet VALDA compte une quinzaine de membres. Ils travaillent sur les aspects fondamentaux et les systèmes de la gestion de données complexes, en particulier celles produites par l’activité humaine. Finalité de ces recherches : optimiser des ressources complexes comme le temps et l’espace de calcul afin d’en extraire de la valeur. Les principaux domaines d’application concernent les systèmes de gestion des informations personnelles (ou « PIMS ») qui aident les utilisateurs à exercer un plus grand contrôle sur leurs données à caractère personnel : e-mails, calendrier, contacts, recherches sur le web, informations de voyage, etc.