Les nouveaux défis du codage numérique

Correction d’erreurs, très haut débit, stockage sur ADN, apports de l’IA… Une équipe de chercheurs du département Mathematical & Electrical Engineering (MEE) d’IMT Atlantique planche sur les dernières avancées du codage qui joue un rôle clé dans tous les systèmes de communication numérique. L’école organisera aussi, en septembre, l’International Symposium on Topics in Coding, ISTC 2023, principal colloque scientifique sur ces sujets.

Essor des télécommunications, du big data, des réseaux sociaux, de l’IA… L’expansion continue du numérique génère des quantités vertigineuses de données sous forme de bits (successions de 0 et de 1) - dans lesquelles peuvent se glisser des erreurs dues à des causes diverses : signal trop faible, bruit parasite, panne, défaut du support… De quoi nuire à la compréhension du message. D’où la nécessité de concevoir des systèmes de codage, de stockage et de décodage capables de pallier ces erreurs, ou du moins d’en réduire sensiblement le nombre.

Tel est le sujet sur lequel travaille l’équipe CODES du département Mathematical & Electrical Engineering (MEE) d’IMT Atlantique. Composée de 5 enseignants-chercheurs, une dizaine de doctorants et 3 « post-docs », elle opère en lien avec le laboratoire Lab-STICC (1), qui réunit une demi-douzaine d’établissements scientifiques de Bretagne océane. Son travail consiste à concevoir et développer des solutions de codage «correcteur d’erreurs » et de codage de source pour tous les systèmes de communication et de stockage numériques.

« La correction d’erreurs est une fonction de la couche physique, qui intervient en interaction avec les autres fonctions du système, explique Raphaël Le Bidan, un des enseignants-chercheurs du MEE. Le principe consiste à introduire dans le message certaines redondances - les moins nombreuses possible - pour éviter ou corriger un maximum d’erreurs, tout en conservant un code simple à utiliser. » En dépit de cette contrainte, le codage correcteur d’erreurs, qui a d’abord été utilisé pour les communications spatiales, offre un certain nombre d’avantages : il permet de rendre le message plus « robuste » , et donc d’augmenter la portée de l’émetteur, de réduire la puissance des batteries. »

Equipe CODES : Catherine Douillard, Elsa Dupraz, Charbel Abdel Nour et Raphaël Le Bidan
Catherine Douillard, Elsa Dupraz, Charbel Abdel Nour et Raphaël Le Bidan.


« Le codage fait appel à des disciplines multiples, indique de son côté Catherine Douillard, professeur et adjointe au chef du département MEE, qui travaille depuis près de 30 ans dans ce domaine. Il se situe à la croisée de la théorie de l’information, de l’algèbre et des mathématiques discrètes, et nécessite aussi des compétences en électronique. »

Au plus près des limites théoriques

Le principal défi consiste à élaborer des codes et des algorithmes de décodage capables d’approcher au plus près des limites théoriques en correction/compression énoncées par le mathématicien américain Claude Shannon à la fin des années 1940. Théoriquement, on sait que des codes très longs, qui comportent des dizaines voire des centaines de milliers de bits, permettent d’atteindre un tel niveau de performance. Mais ils posent de redoutables problèmes de mise en œuvre lorsqu’il s’agit de respecter des contraintes pratiques, en termes de spécifications système ou matérielles (consommation d’énergie limitée, garantie d’intégrité des calculs).

Au début des années 1990, des chercheurs de Télécom Bretagne (devenue IMT Atlantique en 2017), parmi lesquels Claude Berrou et Alain Glavieux, ont réalisé une percée décisive avec la mise au point d’une nouvelle classe de codes correcteurs, les « turbo-codes ». Ceux-ci ont notamment été utilisés dans des standards de téléphonie mobile : 3G, 4G et une partie de la 5G.

« Aujourd’hui, nous sommes confrontés à de nouveaux défis, explique Catherine Douillard. Les systèmes de communication sont devenus plus complexes, les exigences en termes de fiabilité des données sont plus fortes : à titre d’exemple, pour les communications optiques, on ne tolère plus guère qu’une erreur pour 10 puissance 15 bits transmis. On cherche à obtenir des débits toujours plus élevés, tout en limitant la consommation électrique des circuits. Dans certains systèmes, nous visons jusqu’au terabit/seconde. » Une des solutions consiste à utiliser des architectures parallèles.
La montée en puissance de l’Internet des objets, par exemple, nécessite l’emploi de paquets très courts. On ne comprend pas encore bien le comportement et  la construction de codes courts, mais le recours à l’intelligence artificielle apparaît comme un levier possible. Raphaël Le Bidan dirige ainsi un projet financé par l’ANR (2), « AI4Code », qui réunit une demi-douzaine de laboratoires de l’Hexagone autour de dispositifs de codage et décodage destinés notamment à l’Internet des Objets et à toutes ces nouvelles formes de systèmes de communications basés sur la transmission de tout petits paquets de données.

Les promesses du stockage sur ADN

Autre voie de recherche, le stockage de données sur des brins d’ADN synthétique. « L’ ADN présente de nombreux atouts : c’est un support très compact - une camionnette suffirait pour contenir toute l’information numérique disponible dans le monde, souligne Elsa Dupraz, maître de conférences au MEE. De plus, on peut l’utiliser à température ambiante, et il est durable. » De premiers démonstrateurs ont été élaborés - notamment par Microsoft. Toutefois, le séquençage de l’ADN introduit beaucoup d’erreurs (modification, insertion et suppression de  symboles aléatoirement), différentes de celles de l’univers des télécoms. « Nous travaillons surtout dans deux directions : la modélisation statistique de ces erreurs liées au support ADN, et la mise au point de codes correcteurs », précise Elsa Dupraz. Des travaux qui font l’objet d’un PEPR (Programme et équipement prioritaire pour la recherche) exploratoire baptisé MoleculArXiv, qui réunit plusieurs équipes en France. Piloté par le CNRS, il est doté d’un budget de 20 millions d’euros sur 7 ans.

« Au-delà des enjeux scientifiques proprement dits, se posent aussi des questions de souveraineté », ajoute Charbel Abdel Nour, lui aussi professeur au département MEE et co-président du comité de programme d'ISTC 2023. Il est en effet important de disposer en France et en Europe d’équipes de pointe sur ces technologies clés, qui jouent un rôle majeur dans l’innovation et le développement économique - notamment par le biais des normes. L’Institut Mines-Télécom a ainsi répondu à un appel à projet sur la souveraineté numérique (PIA4), géré par l’ANR. Associé à la SATT (3) Ouest Valorisation, l’institut souhaite « renforcer l’accompagnement de projets » et développer la propriété intellectuelle en produisant des « grappes » de brevets. Au cours des dernières années, l’équipe a déjà déposé une vingtaine de brevets - l’un d’entre eux est même devenu un standard international pour la TNT de 2ème génération.

 

ISTC 2023

Un symposium international sur le codage à Brest

IMT Atlantique a été retenue pour organiser à Brest, du 4 au 8 septembre prochains, la conférence ISTC (International Symposium on Topics in Coding), qui accueille tous les deux ans les meilleurs spécialistes du codage. Y sont attendus 150 à 200 chercheurs venus du monde entier. On y traitera notamment du quantum (codage quantique) et de l’apport des techniques d’IA - par exemple pour l’acquisition de nouveaux modèles de codage à hautes performances. Une forme de reconnaissance internationale pour l’équipe du département MEE et pour l’école qui a été à l’initiative de la première édition en 1997.

 

  • (1) Laboratoire des Sciences et technologies de l’information, de la communication et de la connaissance (CNRS UMR 6285). Pôle de référence de niveau international sur les systèmes communicants, le Lab-STICC regroupe plus de 500 personnes dont 220 chercheurs et enseignants-chercheurs rattachés à plusieurs établissements (CNRS, ENIB, ENSTA Bretagne, IMT Atlantique, UBO et UBS).
  • (2) Agence Nationale de la Recherche.
  • (3) Société d’Accélération du Transfert de Technologies.

En savoir plus

Publié le 06.03.2023

par Fabienne MILLET-DEHILLERIN