La science des données — un vaste domaine comprenant la statistique, l'apprentissage automatique, le traitement du signal, la visualisation des données et les bases de données — fait désormais la une des journaux et a un impact potentiel majeur sur la société, au-delà du rôle important qu'elle a joué en sciences pendant de nombreuses décennies. Au sein de ce domaine, la communauté statistique a une longue expérience de comment déduire des connaissances à partir de données, sur des bases mathématiques solides. Le domaine plus récent de l'apprentissage automatique a également donné lieu à des réalisations majeures, en combinant statistique et optimisation, et en utilisant un point de vue nouveau provenant d'applications où la prédiction est plus importante que la construction de modèles.
Le positionnement de l'équipe-projet CELESTE est à l'interface entre statistique et apprentissage. Nous sommes statisticien(ne)s, membres d'un laboratoire de mathématiques, avec une solide formation en mathématiques, et sommes intéressé(e)s par les interactions entre théorie, algorithmes et applications. En effet, les applications conduisent aux problèmes théoriques les plus intéressants, tandis que la théorie peut jouer un rôle clé pour (i) comprendre comment et pourquoi les algorithmes d'apprentissage statistique efficaces fonctionnent — et donc les améliorer — et (ii) construire de nouveaux algorithmes sur des bases de statistique mathématique.
Nous étudions ainsi plusieurs des défis de l'apprentissage automatique sous l'angle de la statistique mathématique, en gardant toujours à l'esprit que les jeux de données modernes sont souvent de grande dimension et/ou de grand volume, ce qui doit être pris en compte dès la conception des algorithmes d'apprentissage. Il y a en particulier souvent un compromis à trouver entre précision statistique et complexité algorithmique, que nous souhaitons éclairer autant que possible.
Finalement, un ingrédient clé de notre programme de recherche est de confronter nos résultats théoriques et méthodologiques à la réalité de (nombreuses) applications. C'est pourquoi une grande partie de notre travail est consacrée à la modélisation de données industrielles ou médicales, en lien avec différents problèmes issus de nos collaborations de longue date avec plusieurs partenaires, ainsi que de diverses collaborations ponctuelles opportunistes.
Centre(s) inria
Centre Inria de Saclay
En partenariat avec
CNRS,Université Paris-Saclay
Responsable de l'équipe
Assistant(e) de l'équipe
16 février – 25 avril 2024
Exposition
Forum des Arts et de la Culture
Lieu :
Forum des Arts et de la Culture
Exposition
Environnement
Analyse de données
Hôpital Pédiatrique de Yangon, Birmanie. Les médecins analysent les résultats du scanner cérébral d'un jeune patient souffrant d'encéphalite © Institut Pasteur/Pyay Kyaw Myint
Environnement