Maîtresse de conférences à IMT Atlantique, au département Mathematical and Electrical Engineering (MEE), et membre du Lab-STICC, Elsa Dupraz a reçu le Prix Espoir IMT-Académie des sciences pour ses recherches sur les codes correcteurs d’erreurs, qui permettent de réduire la consommation électrique des systèmes de communication. Un domaine aux multiples applications.
Vous êtes lauréate 2024 du Prix Espoir IMT-Académie des sciences, pour vos travaux sur les codes correcteurs d’erreurs. Quel est le principe de ces codes ?
Dans tous les systèmes de communication numérique - réseaux de télécommunications, wifi, etc. - il existe des aléas : bruit de fond, réverbération, distorsion… Ils perturbent la transmission et génèrent des erreurs. Les codes correcteurs (aussi appelés « codage canal ») servent justement à pallier ces erreurs. Comment ? Pour l’essentiel, en introduisant des redondances dans le message. Même si le message est plus long, cela permet de réduire la puissance d’émission du signal, , ce qui représente un gain important en énergie. Or la réduction de la consommation d’électricité des dispositifs numériques est aujourd’hui une priorité. Ce n’est pas tout : si un appareil consomme davantage, sa batterie faiblit plus vite et il perd donc en autonomie… C’est pourquoi nous cherchons à concevoir des codes à la fois assez « simples » et donc peu gourmands en énergie, et qui garantissent une transmission fiable.
Ces codes correcteurs sont aujourd’hui très répandus. On les utilise dans tous les systèmes de transmission : le téléphone, l’ordinateur, le wifi, mais aussi pour la compression de données.
Elsa Dupraz et Françoise Combes, vice-présidente de l’Académie des Sciences
Crédit photo © Académie des sciences – Mathieu Baumer.
Quelle économie d’énergie permettent d’obtenir ces codes ?
Elle varie énormément suivant les cas. En associant diverses méthodes, on peut atteindre un gain de 50 % - et parfois bien davantage.
Précisément, quelles méthodes utilisez-vous ?
Avec mon équipe, composée de quatre doctorants, un « post-doc », et de divers collaborateurs en France et à l’étranger, , nous travaillons sur trois pistes différentes. La première est le stockage sur ADN - une idée qui remonte à une dizaine d’années. Le stockage de données consomme beaucoup d’énergie, comme on peut le voir avec les data center. L’ADN, lui, présente deux avantages : il est très dense, car ses molécules sont très petites - on dit que toutes les données du monde tiendraient dans une petite camionnette d’ADN. Et il est robuste : il dure longtemps (plusieurs dizaines d’années au moins) et résiste à des températures faibles comme élevées.
Comment stocker de l’information dans des molécules d’ADN ? Ce n’est pas simple, car il faut passer du digital au vivant. Autrement dit, convertir des fichiers binaires en fichiers quaternaires, conformément à la structure de l’ADN (avec ses quatre éléments clés, les bases A, T, C et G). On utilise pour cela de l’ADN de synthèse, inactivé, que les biologistes savent fabriquer pour des usages médicaux.. En sens inverse, on viendra lire ces données stockées dans l’ADN, grâce au même procédé que pour le séquençage.
Mais la lecture de l’information ainsi stockée n’est pas toujours fiable. Elle comporte des erreurs, et celles-ci sont différentes de celles qu’on rencontre dans le domaine des télécoms : il n’y a pas de bruit, , mais plutôt des substitutions, des délétions (suppressions) ou des insertions (ajouts de bases). Mon travail consiste donc à détecter ces erreurs, et à élaborer des codes correcteurs conçus pour l’ADN, à l’aide d’algorithmes dédiés. Ce projet s’inscrit dans le cadre de l’important PEPR MoleculArXiv (1), qui réunit une vingtaine d’équipes de recherche françaises, avec un financement de 20 millions d’euros jusqu’en 2029. Un simulateur de canal que nous avons conçu, disponible en logiciel libre, est déjà utilisé par plusieurs équipes du PEPR.
Quelle est la deuxième piste sur laquelle vous travaillez ?
Elle consiste à mettre en œuvre des architectures de calcul dans la mémoire. Un processeur comporte en général deux parties : un système de calcul et une mémoire. Entre les deux, des allers-retours incessants, qui consomment forcément beaucoup d’énergie. C’est le cas notamment pour l’IA, avec ses réseaux de neurones qui contiennent un nombre extrêmement élevé de paramètres. Pour éviter ces trajets multiples, on peut réunir le système de calcul et la mémoire. Cela implique de recourir à de nouveaux types de mémoires, les mémoires vives non volatiles (NVRAM). Le hic, c’est qu’elles aussi produisent des erreurs… Et que celles-ci peuvent alors se répercuter sur les calculs !
Nos travaux visent donc à concevoir des codes capables de retrouver le bon résultat - si possible en évitant d’ajouter trop de redondances dans le calcul. Nous avons notamment élaboré une nouvelle méthode de prédiction de l’effet des fautes dans les poids des réseaux de neurones. Nous utilisons également des décodeurs particuliers, dits LDPC (« Codes de densité à faible parité »), qui sont robustes aux fautes. Grâce à ces outils, des méthodes d’IA pourraient ainsi, à terme, être intégrées dans des architectures de calcul en mémoire.
Et votre troisième sujet de recherche ?
Il concerne l’apprentissage sur données compressées. Pour entraîner un modèle d’IA, il faut en effet lui fournir d’énormes quantités de données - des millions d’images par exemple - qui sont en général compressées. Décompresser ces données est à la fois très long et très gourmand en énergie. Une solution consiste donc à se passer de la décompression, et à effectuer l’apprentissage directement à partir des données compressées, sans avoir à les reconstruire.
Mais les outils classiques de compression (les codeurs « entropiques ») ne conviennent pas, car ils ne conservent pas certaines propriétés de localisation des données. D’où l’idée de notre équipe, qui consiste à revoir la chaîne de compression, et à remplacer une partie des outils de compression par des « codes linéaires », dérivés du codage canal. Ce procédé permet d’améliorer la rapidité de l’apprentissage tout en maintenant une compression efficace. On peut en espérer d’importantes réductions de la consommation d’énergie. Ce projet a bénéficié du financement du Labex CominLabs, dédié au numérique. Ajoutons que pour l’an prochain, nous prévoyons d’élaborer un démonstrateur logiciel de codeur d’images Jpeg, qui sera ouvert à la communauté de recherche.
Comment parvenez-vous à travailler en parallèle sur trois projets aussi différents ?
Ma spécialité, ce sont les codes correcteurs. C’est un domaine que l’on retrouve dans les trois projets sur lesquels je travaille. Ce qui m’amène à collaborer avec des équipes très diverses : des biologistes et des bio-informaticiens pour le stockage sur ADN, des spécialistes de la théorie de l’information et de la compression pour l’apprentissage sur données compressées, des experts des architectures matérielles pour le calcul en mémoire… Il faut comprendre la logique et les problématiques de chacun d’eux, tout en apportant son expertise propre. C’est une approche très pluridisciplinaire, et une gymnastique stimulante.
Laquelle de ces trois pistes vous paraît la plus prometteuse ?
A court terme, la compression est sans doute celle qui offre le plus de perspectives. Le calcul en mémoire, c’est plutôt du long terme. Quant au stockage sur ADN, il reste encore un pari pour un avenir assez lointain - d’autant que le coût élevé de la synthèse de molécules d’ADN est un frein. Microsoft a cependant présenté un démonstrateur en 2019.
Tous ces travaux intéressent beaucoup d’acteurs, mais il s’agit encore de recherche amont. De plus, dans le domaine des codes correcteur d’erreurs, des défis importants subsistent. On ne sait pas bien, par exemple, comment procéder avec les messages très courts - ceux qu’émettent par exemple les capteurs utilisés dans les process industriels. De plus, les codes correcteurs, pour moi, ne sont pas limités aux télécoms : ils peuvent s’appliquer à bien d’autres domaines, comme ceux dont nous venons de discuter, mais mais aussi dans celui de l’usine du futur ou de la voiture autonome.
Que représente ce prix « Espoir » pour vous ?
Il constitue bien sûr une reconnaissance pour mes travaux et pour mon équipe d’IMT Atlantique, et un encouragement à poursuivre dans cette voie. C’est aussi un moyen d’attirer l’attention sur le domaine du codage correcteur. Il s’agit d’un outil générique qui peut contribuer à résoudre nombre de problèmes importants. Ajoutons que ce prix confirme que Brest est un des endroits qui comptent pour le codage, en France et en Europe. Une technologie de codage moderne, les « turbo-codes », a d’ailleurs été inventée à Brest dans les années 1990 par des chercheurs de Télécom Bretagne, devenue IMT Atlantique en 2017.
(1) Programme et équipement prioritaire de recherche.
Elsa Dupraz est félicitée par Cécile Dubarry, DG de l’IMT, François Baccelli, président du jury du prix IMT- Académie des Sciences et Yann Busnel, directeur scientifique de l’IMT
Le parcours d’Elsa Dupraz
« Curieusement, la plupart des institutions que j’ai fréquentées ont fusionné avec d’autres et ont changé de nom », s’amuse Elsa Dupraz. La jeune chercheuse a d’abord étudié au département électricité-électronique de l’ENS de Cachan, devenue ENS Paris-Saclay, puis à Supélec (aujourd’hui Centrale-Supélec). Elle a effectué sa thèse (sur la compression de données) au Laboratoire signaux et systèmes (LSS) de l’université Paris-Sud, désormais baptisée Paris-Saclay. Puis poursuivi par un post-doc à l’université d’Arizona à Tucson, en lien avec l’université Cergy-Pontoise (aujourd’hui CY Cergy Paris Université). En 2015, elle a obtenu un poste d’enseignante-chercheuse à Telecom Bretagne, fusionnée en 2017 avec Mines Nantes pour devenir IMT Atlantique… Depuis 2023, Elsa Dupraz est également titulaire d’une HDR (Habilitation à diriger des recherches).
https://elsa-dupraz.fr/
Les Prix IMT-Académie des sciences
Depuis 2017, l’Institut Mines-Telecom (via sa Fondation) et l’Académie des sciences décernent chaque année un « Grand Prix » et un « Prix espoir », ce dernier étant destiné à des scientifiques âgés de moins de 40 ans. Les deux Prix récompensent des chercheurs ayant particulièrement contribué à « faire progresser des problématiques issues du monde industriel ou de l’entreprise, au service d’une économie durable. » Quatre domaines sont concernés : l’industrie du futur, la souveraineté et la sobriété numériques, l’ingénierie de l’énergie et de l’environnement, la santé.
Plus d'info
par Fabienne MILLET-DEHILLERIN