S’informer à l’heure de la presse numérique

La transition de l’information imprimée vers le numérique a particulièrement remodelé le domaine de la presse papier. Les chercheurs et chercheuses d’IMT Atlantique rapportent les transformations de cette industrie, sous l’impulsion des technologies numériques. De la démultiplication des entités productrices de contenu à l’injonction incessante à délivrer rapidement, parfois au détriment de la qualité.

Compagnons matinaux des usagers du métro, en vente dans les kiosques ou en pile dans les cafés et les restaurants, les journaux imprimés faisaient partie intégrante du paysage urbain il y a encore vingt ans de cela. Graduellement, la montée en puissance des technologies numériques a éclipsé ce symbole emblématique et séculaire de la diffusion de l’actualité : les gazettes, canards et autres feuilles de choux ont peu à peu cédé la place à leurs homologues en ligne.

Si la transformation numérique de la presse a commencé par ce passage en ligne des titres historiques, elle se manifeste aujourd’hui de manière beaucoup plus complexe. La transition vers l’information à portée de clic a entraîné – et entraîne encore – des modifications profondes de cette industrie : sur la production comme sur la « consommation » de l’information, et les caractéristiques-mêmes des contenus.

Économiste à IMT Atlantique, sur le campus de Brest, Inna Lyubareva étudie la transformation digitale des industries culturelles et des médias. Dans ces secteurs, comme la musique, les livres, ou la presse, le contexte d’innovation technologique impulsé par internet est particulièrement favorable à l’émergence de nouveautés, en matière de modèles économiques, de pratiques de consommation ou encore de formats. Au sein de ces industries, la presse – média historique de l’information et territoire d’expression de la société civile – se distingue par son rôle sociétal structurant, comme vecteur de la démocratie. C’est pourquoi la chercheuse en a fait l’un de ses sujets d’étude privilégié : à l’aune des technologies numériques et de leurs dynamiques, elle analyse les facteurs favorables, et inversement les risques et menaces, au pluralisme et à la qualité de l’information en circulation. Son but : que dans ce nouvel écosystème, l’information continue d’assurer son rôle démocratique au sein de la société.

Inna Lyubareva : s’informer à l’heure de la presse numérique
Inna Lyubareva, « S’informer à l’heure de la presse numérique »

De la presse institutionnelle au « snack content »

Une des premières conséquences de la transition numérique est que le spectre de personnes qui produisent du contenu est beaucoup plus large. « Avant il n’y avait que les titres de presse grand public traditionnels. Aujourd’hui, n’importe qui peut ouvrir un blog et produire de l’information. De fait, les questionnements « historiques » liés au pluralisme et à la diversité des sources ont laissé la place à de nouvelles interrogations, concernant surtout la qualité », contextualise Inna Lyubareva.

La révolution numérique a également amené une nouvelle temporalité, à laquelle la presse n’a pas échappé. D’un côté, la production de l’information est contrainte par un rythme soutenu et ininterrompu, connue sous l’appellation de « speed-driven journalism ». De l’autre, l’audience, submergée par une quantité vertigineuse d’informations, a de moins en moins de temps à dédier à la lecture de contenus. Exit donc les articles d’investigation sur cent pages ! Les publications en ligne sont de plus en plus courtes, jusqu’au « snack content », c’est-à-dire « consommable » le temps d’un sandwich.

Le speed-driven journalism induit aussi intrinsèquement une production impétueuse, souvent au détriment de la qualité, ou du moins de la vérification des faits (fact-checking). Les informations paraissent et sont vérifiées a posteriori, dans la logique du « Talk First, Think Later » (Parler d’abord, réfléchir ensuite). Ce contexte facilite la circulation de nouvelles fallacieuses (fake news) et de rumeurs, mais aussi la publication d’informations de rectification, venant infirmer les précédentes non-vérifiées, et donc, la coexistence en ligne d’information contradictoires.

Les réseaux sociaux, entre ouverture et enfermement

Dans ce nouvel écosystème, les réseaux sociaux sont devenus une source d’information incontournable. Véritables fenêtres sur le monde, ils permettent de toucher une audience très large, notamment grâce à leurs fonctionnalités de partage – ou de « retweet ». Ces facteurs d’amplification sont également à la source de mécanismes de viralité, pour le meilleur, comme pour le pire. Nul besoin de s’étendre davantage sur le potentiel de ces plateformes à diffuser des informations douteuses.

Pourtant, aux antipodes de la surexposition et de l’embrasement médiatique que peuvent provoquer les réseaux sociaux, ces derniers sont aussi propices au communautarisme. La consommation de contenu journalistique sur ces plateformes peut amener à participer aux échanges dans les espaces de commentaires. Au fil de discussions régulières, avec les mêmes personnes, sur des sujets ciblés, des communautés apparaissent, qui deviennent de plus en plus soudées, et parfois même s’isolent : elles sont alors qualifiées de « chambres d’écho ».

L’influence d’opinion par le truchement d’interactions à répétition est un phénomène très fréquent, et pas nécessairement négatif. « Il est très commun que deux personnes qui cherchent à se convaincre mutuellement, finissent par aligner leurs opinions. Mais en ligne, le passage à l’échelle est tel que ce type d’échanges peut conduire à un enfermement idéologique, et présenter un risque du point de vue du pluralisme de l’information », alerte Inna Lyubareva.

Une approche pluridisciplinaire pour collecter des données

Pour cerner les phénomènes en jeu, Inna Lyubareva combine des méthodes de sciences sociales traditionnelles – comme des méthodes quantitatives et qualitatives – et des méthodes informatiques issues notamment de la science des données. Pour l’étude des communautés en ligne, Inna Lyubareva, en lien avec les chercheurs de l’équipe DECIDE du Lab-STICC, a procédé à l’analyse sur Youtube d’une soixantaine de chaînes de média français, comme celle du Monde, en recueillant les commentaires de toutes les vidéos.

Dans le cadre d’une collaboration avec la société Magic LEMP, spécialiste en intelligence artificielle, la chercheuse et son équipe ont aussi analysé des fake news dans la presse en ligne. Pour cela, ils analysent les contenus en circulation sur Twitter (nouvellement X), et les interactions autour de ces contenus, dans la presse de tout bord politique. « Nous avons eu la chance de pouvoir récupérer les données de Twitter quand c’était encore possible, juste avant le changement de la plateforme en X », reconnait Inna Lyubareva.

Sur la base d’informations fallacieuses et de rumeurs pré-identifiées, l’équipe essaie de détecter les caractéristiques propres aux posts associés, afin d’élaborer un modèle prédictif de ces informations à risque. « Pour retrouver de manière automatique dans les médias les contenus liés à un événement fake donné, il faut des mots-clés explicites et spécifiques à cet événement. Surtout, sur les réseaux sociaux où le volume d’information est énorme. Mais en utilisant les bons mots-clés, nous avons réussi à collecter une très grande quantité de données pour nos analyses », détaille la chercheuse.

Des fake news, reprises et répétées

Une des caractérisations des fake news identifiée au cours de ces travaux est l’existence d’une plus grande proximité sémantique entre différents articles relayant des fake news, qu’entre différents articles relayant des faits avérés. Concrètement, les premiers rapportent la même chose, avec une moindre diversité d’interprétation. En toute logique, les contenus rapportant des fake news réemploient au mot près les termes du contenu source – qui est rarement vérifié – voire même le citent explicitement. Ce qui est moins le cas d’un article original de journalisme, basé sur des faits vérifiés.

Les fake news restent également en circulation beaucoup plus longtemps que les informations avérées. Tandis que ces dernières vont afficher un pic de notoriété au moment de leur parution, la courbe de circulation des événements problématiques, comme les fakes ou les rumeurs, peut afficher plusieurs pics supplémentaires après leur parution.

En republiant sur les fake news des informations de rectification, les titres de presse participent effectivement, de manière malencontreuse mais active, à la (re)circulation de ces informations. Un phénomène, amplifié par les nouvelles pratiques de lecture rapide et partielle des contenus, que nuance Inna Lyubareva. « Ces nouvelles présentent un risque pour des populations moins averties, mais il ne faut pas présumer de la naïveté du public. Si elles restent en circulation c’est aussi parce qu’il est probablement plus intéressant ou amusant d’en discuter ! »

durée de vie des informations en circulation sur internet
Graphe représentant la « durée de vie » des informations en circulation sur internet (à g.) et X (ex-Twitter, à d.). Les informations vraies en bleu bénéficient d’une notoriété forte et limitée dans le temps comparées aux rumeurs en rouge/rose ou aux fakes en brun dont la notoriété est moins forte mais dure plus longtemps. Crédits: Inna Lyubareva.

ChatGPT, un moteur de recherche comme les autres ?

Inna Lyubareva s’intéresse également à la structuration de l’offre informationnelle, c’est-à-dire les sources d’information proposées aux internautes par le prisme des moteurs de recherche. « Un moteur de recherche est un premier filtre dans notre accès à l’information », analyse la chercheuse. « Si vous voulez vous informer sur une question d’actualité, vous allez vous appuyer sur les ressources proposées par le moteur de recherche que vous avez l’habitude d’utiliser. Celui-ci peut être configuré dans plusieurs sens, en tous cas, il n’est jamais neutre. »

Sur ce sujet, elle collabore avec l’Institut de Recherche en Informatique et Systèmes Aléatoires (IRISA), qui a élaboré un outil, SNIDE, permettant de mesurer la neutralité des différents moteurs de recherche. SNIDE affiche les dix premiers résultats pour chaque moteur de recherche : à partir de cela, les chercheurs et chercheuses analysent comment l’audience s’informe sur un sujet de controverse – en l’occurrence le mouvement Black Lives Matter (BLM) et son équivalent français « Justice pour Adama ». Leur constat est que certains moteurs mettent davantage en avant des médias traditionnels, d’autres des médias plus partisans, d’autres encore plutôt les réseaux sociaux.

À la suite de quoi, Inna Lyubareva s’est intéressée à la réponse de ChatGPT à cette même demande : « Qu’est-ce que le mouvement BLM ? ». L’agent conversationnel fournit une réponse factuelle et dépourvue d’analyse. Ce qui signifie que les individus qui ne s’informeraient que par l’intermédiaire de ChatGPT passeraient à côté de la description du mouvement par ses controverses : la violence policière, les figures de proue de la lutte, l’utilisation des fonds collectés par les organisations impliquées… « ChatGPT coche toutes les cases du média 2.0, mais, comme pour les réseaux sociaux, il n’est pas souhaitable qu’il soit utilisé comme seule source d’information, aussi bien pour la compréhension des sujets d’actualité que pour le débat public », conclut la chercheuse.

En savoir plus

Cet article est republié à partir du blog I'MTech.
Lire l'article original : « S’informer à l’heure de la presse numérique »

Publié le 16.10.2023

par Pierre-Hervé VAILLANT