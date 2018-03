Prix scientifique

29/05/2013

Donner les bases théoriques à la programmation web

Chercheur CNRS, membre de l’équipe TYREX, Pierre Genevès a reçu la médaille de bronze du CNRS pour son travail théorique appliqué et destiné à améliorer les performances et la fiabilité des applications web.

Quels sont les enjeux de vos recherches ?

À l’heure actuelle, un nombre croissant d’activités humaines passe par le Web, que ce soit pour acheter des billets d’avions, consulter son compte en banque, payer ses impôts ou gérer un hôpital. Ces applications concernent un nombre très important de personnes et s’appuient sur des technologies qui ne sont pas totalement matures du point de vue de la sécurité. Ces caractéristiques contribuent à les rendre "critiques". En effet, avec des applications comme Facebook (plus d’un milliard d’utilisateurs) et l’usage exponentiel du mobile, la défaillance de ces systèmes peut être dévastatrice. Pour ne citer que quelques exemples, en 2011 la Citibank aux États-Unis a fait état d’une fuite d’informations bancaires concernant 200 000 clients et en 2012 le réseau social LinkedIn déplorait le détournement de 6 millions et demi de mots de passe !

Mon objectif est d’améliorer les techniques de vérification d’applications web afin de réduire les bugs et améliorer leur fiabilité, mais surtout — et c’est ce qui est nouveau — j’ai conçu une logique computationnelle permettant aux programmeurs de mieux comprendre ce que fait l’application, en particulier de savoir à quelles informations elle accède et comment elle les utilise. (voir encadré)

Quels aspects de votre travail ont retenu l’attention du jury pour cette médaille de bronze ?

Les membres du jury ont apprécié l’aspect vertical de ma recherche, qui va de la contribution théorique à la réalisation des programmes et leur implémentation, ainsi que le fait que le solveur logique que j’ai conçu fonctionne sur des cas concrets. Leur décision a également été motivée par le fait que mes résultats s’appliquent à de nombreux domaines, du Web au génie logiciel en passant par les langages de programmation et l’intelligence artificielle. De plus, ce solveur est très rapide, ce qui permet de l’appliquer à des problèmes qui restaient en suspens depuis six ou sept ans. C’est un verrou technologique qui a sauté.

Quels sont, selon vous, les prochains défis scientifiques de ce domaine ?

Le Web évolue vers plus de dynamisme avec l’utilisation croissante de données envoyées directement dans le navigateur. Ce mouvement s’amplifie suite au développement des capteurs qui fournissent des données en continu (température, données météorologique, notations boursières, etc.). La difficulté principale dans ce cas est que l’on ne connaît pas toutes les données : seule une fenêtre est disponible avec une mémoire limitée sur le passé. Il est indispensable de développer les fondements théoriques permettant de comprendre et de mieux concevoir les programmes qui manipulent ces flux de données car les techniques actuelles de programmation restent peu adaptées pour faire cela correctement. C’est une recherche à long terme.

La logique computationnelle pour comprendre les programmes Les technologies du Web se sont développées beaucoup plus rapidement que les aspects théoriques. Par exemple, le langage de programmation web le plus utilisé, Javascript, a été créé dans l’urgence et n’est plus adapté pour assurer des propriétés comme la sécurité dans les applications web actuelles. Il est nécessaire aujourd’hui de développer de nouvelles méthodes ou de nouveaux langages grâce auxquels le calcul permettrait de s’assurer en amont qu’il n’y a pas de bug , quels que soient l’utilisateur et l’utilisation qui en est faite, comme l’ingénieur fait des calculs de résistance pour construire un pont. Pierre Genevès a conçu un tel algorithme pour analyser ce que fait un programme en XQuery, un nouveau langage de requêtes d’informations sur les pages web et de transformation de ces informations. Cet algorithme détermine, à partir du code source, si le programme accède, par exemple, à des données confidentielles dans toutes les conditions d’utilisation possibles. C’est un problème difficile d’un point de vue computationnel car il faut raisonner de façon efficace sur un ensemble de documents web potentiellement infini puisqu’on ne sait pas a priori quelles seront les données à l’entrée du programme. « J’ai conçu une logique qui permet de raisonner sur la structure particulière des données des pages web (des arbres finis et ordonnés) , explique le chercheur. Cette logique présente de bonnes propriétés théoriques mais aussi pratiques. Elle permet en effet de formuler tous les problèmes de requêtes et de les résoudre très rapidement. » Il est ainsi possible de déterminer si un programme accède ou non à des données confidentielles. Dans le cas positif, le solveur logique est capable de générer le jeu de données d’un contre-exemple permettant au programmeur de mieux identifier et comprendre la cause du bug .

