fbpx

Les progrès de l’intelligence artificielle et des algorithmes de deep learning nous font entrer dans une nouvelle ère aux contours très incertains. Un défi notamment pour les journalistes quand il s’agit de démêler le vrai du faux. Je vous raconte comment j’ai été saisi de vertige en entendant cette semaine des chercheurs européens exposer les avancées ultra rapides des technologies d’IA (ou d’AI en anglais) ces dernières années et ces derniers mois. Les fake news ou les infox ont de beaux jours devant elles, mais ce n’est pas tout…

Comme tout le monde, j’ai entendu parler d’intelligence artificielle et de deep fakes, comme cette vidéo d’Obama où il dit à peu près n’importe quoi et se met à insulter Donald Trump. Mais je n’avais pas vraiment compris à quel point ce qui est en train d’arriver va changer la donne dans un nombre considérable de domaines et pour les journalistes notamment. 

Il aura fallu une réunion du projet de recherche européen JOLT auquel Samsa.fr participe pour que je découvre ce continent émergent qui va déclencher des mouvements tectoniques d’une ampleur imprévisible. Lors de ces quelques jours passés à Pampelune en Espagne aux côtés d’une quinzaine de doctorants et des professeurs qui les encadrent, j’ai pu suivre plusieurs présentations traitant de l’intelligeance artificielle, du machine learning et du deep learning (je vais essayer de vous expliquer les différences) dont celle de Xavier Giro-i-Nieto enseignant-chercheur à Universitat Politècnica de Catalunya, celle de Alan Smeaton, professeur à Dublin City University et celle de Eoin Brophy, doctorant à Dublin City University.

Présentation du chercheur Xavier Giro-i-Nieto lors d’une session du programme de recherche européen JOLT à Pampelune (Photo: Philippe Couve/Samsa.fr)

Sans entrer dans les détails techniques que je ne maîtrise pas, nous sommes à la croisée des chemins: trois chemins pour être précis. Le premier, c’est celui des data et de la quantité énorme de données numériques dont nous disposons. Le deuxième, c’est celui des algorithmes et leur capacité à trier, filtrer, choisir. Enfin, le troisième est le plus inattendu. C’est celui des GPU.

L’intelligence artificielle à des coûts de plus en plus faibles avec les GPU

GPU, l’acronyme évoque pour moi les jeux vidéo et les processeurs graphiques qui les font tourner et rendent leurs images fluides et réactives. Ce GPU (de l’anglais Graphics Processing Unit) est la clef du développement de l’intelligence artificielle. Comme l’explique la fiche Wikipédia, ces processeurs peuvent traiter des opérations en parallèle et « leur parallélisme massif les rend aussi intéressants comme processeurs de calcul matriciel, ou pour des cassages de code en « force brute »1 d’archives chiffrées. Enfin, leur rapport performance/prix les avantage pour le calcul ». Et dans ce domaine, la firme NVIDIA est le leader du moment.

Un processeur graphique GeForce 6600GT de Nvidia. (Photo: Berkut CC BY-SA 3.0)

En résumé, la puissance de calcul offerte par les GPU combinée avec des algorithmes efficaces permet de traiter des quantités énormes de données rapidement et à moindre coût. Et c’est là que les avancées dans les techniques d’algorithmes entrent en jeu pour donner naissance au deep learning.

Le moment est venu de distinguer 3 notions:

  • intelligence artificielle (c’est elle qui a permis à l’ordinateur de battre l’homme aux échecs)
  • machine learning (c’est ce qui permet de trier les spams automatiquement dans votre boîte mail)
  • deep learning (c’est ce qui permet à la machine de reconnaître et différencier des chats et des chiens sur des photos qu’on lui soumet)

(source: NVIDIA)

La question de la reconnaissance automatique des chats et des chiens est considérée comme définitivement réglée par les scientifiques depuis 2016/2017. En effet, le taux d’erreur des machines est inférieur à celui des humains. Les photos soumises ne sont pas toujours très bonnes et peuvent aussi tromper un humain. 

Le deep learning change la donne pour l’intelligence artificielle

Dans ce domaine 2013 a été une année charnière avec une augmentation spectaculaire de la qualité des machines grâce au recours au deep learning. C’est l’histoire assez fascinante du challenge ImageNet qui a mobilisé les chercheurs dans un défi à l’échelle mondiale pour mettre au point les solutions les plus performantes. Mais c’est une autre histoire.

Tout s’est passé en l’espace de quelques années, à une vitesse impressionnante racontait l’un des initiateurs de cette révolution, le Français Yann Le Cun (aujourd’hui chez Facebook) au Monde en 2015: « Je n’ai jamais vu une révolution aussi rapide. On est passé d’un système un peu obscur à un système utilisé par des millions de personnes en seulement deux ans. ».

Yann Le Cun, directeur de recherche en IA chez Facebook(Photo: Jérémy Barande / Ecole polytechnique Université Paris-Saclay / CC BY-SA 2.0)

Ce qui vient ensuite est encore plus fascinant. Non seulement la machine est capable de reconnaître et d’identifier des images toute seule avec des « réseaux de neurones ». Mais maintenant, elle est aussi capable de produire des faux, des répliques, des imitations tout à fait crédibles.

Les GAN (generative adversial networks) font entrer les fake news dans une nouvelle dimension 

C’est là que les GAN entrent en jeu. Ces Generative adversarial network ou réseaux antagonistes génératifs imaginés en 2014 sont une famille d’algorithmes qui combinent deux réseaux. Le premier réseau est le générateur, il génère un échantillon (par exemple une image), tandis que le second réseau joue le rôle de son « adversaire, en essayant de détecter si un échantillon est réel ou bien s’il est le résultat du générateur. Et c’est comme ça qu’on arrive à faire proférer des injures à Barack Obama.

La puissance de la révolution en cours est impossible à mesurer et difficile à concevoir. Elle a déjà des applications concrètes. 

Chez Facebook, Instagram ou Whatsapp, la panne récente a été l’occasion de se rendre compte que les images sont automatiquement associées avec des mots qui les décrivent. Ce que Sébastien Bailly, responsable innovation chez Samsa.fr, avait déjà pointé en 2016. Dans nos iPhone, les photos sont automatiquement classées et si vous avez assisté à un mariage et si vous tapez « mariage » dans la recherche d’images, vous verrez émerger tous les images enfouies dans les profondeurs de la mémoire de votre smartphone et qui montrent des gens endimanchés.

(Source: blog du modérateur)

Un programme permettait de créer des fausses photos de personnalités nues. Mais cette application DeepNude a été mise hors circuit par ses créateurs, semble-t-il. Mais elle refait surface. Un autre permet de changer seulement quelques mots dans un discours prononcé sur une vidéo. Mais quelques mots peuvent tout changer, par exemple s’il s’agit d’un cours de bourse. Il suffit parfois d’une seule image pour pouvoir générer une vidéo.

(Source: Vice media)

La photo ou la vidéo ne sont pas les seuls domaines concernés. Une agence spécialisée en communication digitale britannique (Fractl) a demandé à une intelligence artificielle baptisée Grover de produire le contenu d’un blog et celui-ci a tout d’un vrai. Mais le projet initial de cette IA est pourtant de détecter les fakes news (ou infox) produites par des réseaux de neurones artificiels. Résultat: elle peut aujourd’hui générer de faux articles à partir de n’importe quel site en en respectant parfaitement la tonalité.

Journalistes et politiques soumis à de nouveaux défis avec les deep fakes

Dans un univers déjà saturé de fake news en tout genre, ces deep fakes viennent défier les journalistes et bien au delà. Le Congrès américain s’est emparé de la question après la mise en ligne d’une fausse vidéo de la chef de file de l’opposition démocrate, Nancy Pelosi.

La question de la preuve en image va être compliquée désormais. Et c’est un chantier colossal qui s’ouvre. Mais ce n’est pas le seul. On parle essentiellement de Deep fakes, mais on pourrait aussi parler de démultiplication d’une personne. Jean-Luc Mélenchon avait utilisé des hologrammes, une technique qui pourrait être renvoyée à la préhistoire lors de la prochaine présidentielle américaine.

Ne peut-on pas imaginer que Donald Trump se mette en scène lui même des doubles virtuels en vidéo qui viendrait parler à chaque électeur ou presque avec des mots personnalisés. On y est presque. Trump et son équipe ont produit 10 000 messages publicitaires différents (texte et photo) pour l’anniversaire du président. Demain, ce pourrait être 10 000 vidéos différentes enregistrées par un vrai-faux Trump démultiplié par la magie du Deep learning.

Je vous avoue que j’ai eu le vertige.