Intervention de Ludovic Haye

Réunion du jeudi 26 janvier 2023 à 9h35
Office parlementaire d'évaluation des choix scientifiques et technologiques

Ludovic Haye, sénateur, rapporteur :

Nous envisagions de nous concentrer sur la surcharge informationnelle et l'« infobésité », mais au fur et à mesure de nos travaux, nous avons choisi de mettre également l'accent sur d'autres conséquences de l'explosion des données si elle n'est pas maîtrisée. Celle-ci peut en effet avoir des conséquences environnementales, sociétales, mais aussi sanitaires.

La collecte et le traitement de données existent depuis l'Antiquité et comme l'explique Robert Darnton, « chaque âge a été, à sa manière, un âge de l'information », même si le développement des technologies numériques a changé la donne : l'explosion actuelle des données dépasse largement celles connues dans les temps anciens.

Le big data se caractérise aujourd'hui par ce que l'on a coutume d'appeler les « 3V » : volume, vélocité et variété des données.

Le volume de données augmente de façon exponentielle : il est passé de 2 zettaoctets en 2010 à 18 zettaoctets en 2016, et il s'établira probablement à 181 zettaoctets en 2025.

Une grande quantité de données – appelées dark data – ne sont pas utiles, mais leur conservation et leur gestion mobilisent des ressources et consomment de l'énergie.

À l'heure du big data, les données sont agrégées et traitées pour en extraire des connaissances, c'est-à-dire de nouvelles données. On distingue deux grands types de méthodes : les modèles statistiques et le machine learning, dans lequel c'est la machine qui construit les modèles algorithmiques de prédiction, afin notamment de cibler les contenus et les publicités.

Les applications sont nombreuses : santé, transports, sciences, amélioration de l'efficacité des entreprises et de la relation client, marketing personnalisé et prédictif, gestion des ressources humaines, etc.

L'explosion des données emporte des conséquences environnementales. Certains data centers sont montrés du doigt pour leur consommation d'énergie et d'eau, celle-ci étant utilisée pour refroidir les serveurs. Aujourd'hui, le numérique est responsable de 3,5 % des émissions de gaz à effet de serre dans le monde et de 4,2 % de la consommation mondiale d'énergie primaire. 44 % des Français le considèrent d'ailleurs comme une menace pour l'environnement. Il convient de préciser que les données représentent une part prépondérante mais difficile à isoler de l'impact environnemental global du numérique.

J'en viens aux impacts sociaux et politiques.

Nous vivons désormais sous l'emprise d'un capitalisme cognitif, entre économie de l'attention et bulles de filtre : les données sont utilisées pour capter finement l'attention des utilisateurs, notamment des jeunes, les exposer à de la publicité ciblée et les enfermer dans des systèmes de recommandation clos sur eux-mêmes.

Le big data se caractérise de plus par la domination des entreprises et des data centers américains ainsi que par l'émergence de nouveaux risques de surveillance de masse, à l'image du programme Prism, par lequel la NSA (National Security Agency) récupérait les données personnelles, ou des dérives observées dans les usages par la Chine de l'application TikTok.

À la première fracture numérique due aux inégalités d'accès aux technologies s'ajoute désormais une seconde fracture numérique, résultant des difficultés à s'approprier les technologies numériques, selon le niveau social et l'éducation.

Pour comprendre la relation entre explosion des données et surcharge informationnelle, il est nécessaire de distinguer donnée, information, connaissance et sagesse. La pyramide DIKW (pour data, information, knowledge, wisdom ) aide à se représenter l'articulation entre ces concepts, dont les relations peuvent être illustrées par l'exemple de la météorologie : les mesures de température relevées chaque jour dans une station météo sont des données. Une courbe montrant l'évolution dans le temps de la température moyenne est une information. Le fait que la température sur Terre augmente en fonction de l'activité humaine est une connaissance, tandis que la modulation de l'activité anthropique selon son impact sur le réchauffement climatique relève de la sagesse.

La surcharge informationnelle ne renvoie pas qu'à l'augmentation du volume d'information mais à la multiplication des canaux de communication : il ne suffit plus de savoir qu'une information nous a été envoyée, il nous faut aussi savoir sur quel support elle nous est adressée – courriel, sms, messagerie instantanée du type de WhatsApp ou Telegram, etc.

La quantité de messages reçus s'accompagne d'une addiction à la communication, aggravée chez certains jeunes par le syndrome Fomo, pour Fear of Missing Out (« peur de rater quelque chose »). De plus, cette surcharge est renforcée par le multitasking et la disparition de la frontière entre vie privée et vie professionnelle.

Les conséquences sont sérieuses. Sur le plan individuel, cela génère du stress, de l'anxiété, des dépressions, voire des burn-out. Au sein des organisations, on observe une baisse de la créativité et de la productivité ainsi qu'un effet de saturation. Enfin, sur un plan global, l'explosion des données entraîne un gaspillage d'énergie et une augmentation de l'empreinte carbone.

Il existe aussi des effets moins visibles mais encore plus profonds, tels que le déclin du raisonnement par déduction au profit du raisonnement par induction, la difficulté, notamment chez les jeunes, à hiérarchiser les informations, ou la modification de nos structures cognitives elles-mêmes : baisse des capacités de concentration, de mémoire, de traitement de l'information…

J'en viens aux solutions et perspectives ainsi qu'à mes recommandations.

Il nous faut tout d'abord recourir à des solutions technologiques qui permettent de mettre en place des architectures de calcul et de stockage, d'utiliser des modèles, des logiciels et des algorithmes, notamment d'intelligence artificielle, de mobiliser des dispositifs d'acquisition et de visualisation, enfin, de développer des techniques d'intégration et de curation des données en vue de sélectionner, éditer et partager les seuls contenus pertinents, via des technologies de « pourriture contrôlée » des données ou via les Personal Information Management Systems (PIMS). à l'avenir, le recours aux technologies quantiques permettra de traiter un très grand nombre de données, mais il est aussi susceptible d'aggraver le « syndrome de Diogène numérique » qui nous guette car il facilitera le stockage et le traitement de volumes de données massives dans des proportions encore bien plus grandes.

Il nous faudra donc, au total, mieux former au numérique et à ses enjeux : comprendre les conséquences des outils numériques, promouvoir la sobriété et l'hygiène numérique, faire connaître la législation sous-jacente, par exemple le règlement général sur la protection des données (RGPD). Il nous faudra également affirmer une ambition de souveraineté numérique et d'indépendance à l'égard des entreprises américaines et chinoises, qui ont actuellement la maîtrise de la quasi-totalité des données, nous efforcer d'encadrer l'usage des algorithmes provoquant des bulles de filtre et promouvoir la déconnexion.

Aucun commentaire n'a encore été formulé sur cette intervention.

Inscription
ou
Connexion