L’IA peut apprendre

Michael Notter @ EPFL Extension School · 16 minutes

Découvrez comment l'IA fait pour apprendre

Comment l’IA imite les êtres humains et finit par les dépasser

Dans notre article précédent, nous avons examiné comment les systèmes d’IA peuvent utiliser des jeux de données pour prédire avec précision des informations telles que le poids ou la taille d’un individu.

Maintenant que nous comprenons un peu mieux le fonctionnement de l’IA et en quoi elle est différente de simples logiciels “à l’ancienne”, nous pouvons nous demander: pourquoi appelons-nous de tels systèmes « intelligence artificielle », ou IA ?

Nous pourrions commencer par réfléchir à ce qui rend les humains et, dans une certaine mesure, les animaux, intelligents.

Les êtres vivants ont la capacité d’acquérir des connaissances et des compétences, puis de les appliquer de nombreuses manières différentes.

Les humains et les animaux sont…

des « êtres qui adaptent leur comportement en fonction de leurs expériences ».

Les systèmes d’IA font quelque chose de très similaire. Ils acquièrent et maîtrisent de nouvelles compétences et capacités en examinant des données et en les utilisant pour développer de nouvelles façons d’accomplir des tâches.

Nous pourrions les appeler…

« des systèmes informatiques qui adaptent leur comportement en fonction des données ».

Mais bien que cette description soit fidèle, vous en conviendrez, elle est un peu trop longue.

Nous utilisons le terme “artificiel” pour simplifier, parce que nous parlons de systèmes informatiques et d’algorithmes, et d’”intelligence” parce que ces systèmes adaptent leur comportement en fonction de données, tout comme les êtres vivants.


Les humains et les systèmes d’IA abordent l’apprentissage de manière différente, mais il y a beaucoup de parallèles dans la façon dont chaque système se développe et puis fait preuve d’intelligence pour atteindre ses objectifs.

Pour découvrir ces parallèles, nous allons observer de plus près trois des principaux domaines de la recherche en IA:

  1. Comment l’IA apprend à lire et à écrire
  2. Comment l’IA apprend à voir et à dessiner
  3. Comment l’IA apprend à apprendre, à échouer et à apprendre à nouveau

Comment l’IA apprend à lire et à écrire

La capacité à communiquer est l’un des principaux traits de l’intelligence humaine. Être capable de transmettre nos pensées, nos intentions et nos idées à l’écrit et à l’oral est ce qui nous différencie principalement des animaux. Malgré cela, comprendre ce qu’une autre personne dit peut être difficile, surtout si elle parle dans une autre langue.

Les premiers programmes informatiques nous aidaient déjà à communiquer en améliorant la lisibilité de nos rédactions et en corrigeant nos fautes d’orthographe et de grammaire. Plus récemment sont apparus des programmes capables de traduire notre texte d’une langue à une autre. Les premières versions des logiciels de traduction étaient assez rudimentaires et avaient tendance à être plus drôles qu’utiles. Elles se servaient de deux dictionnaires et traduisaient presque mot à mot.

L'anglais « Hello, welcome to That’s AI »
devenait en français « Bonjour, bienvenue sur Ceci est IA ».

C’est déjà ça, mais ces programmes simples ne prenaient pas en compte le contexte, les nuances ou les significations implicites des textes. Parfois, une simple traduction littérale donne un résultat insensé, comme cet amusant exemple du français vers l’anglais:

Le français « Mon avocat est périmé »,
en référence au fruit de l’avocatier,
était traduit en anglais en : « My lawyer has expired »,
en référence au métier d’avocat.


Comme nous l’avons vu dans l’article précédent, les programmes informatiques n’ont pas besoin de technologies d’IA pour vérifier les fautes d’orthographe ou traduire simplement mot par mot. Il n’y a pas là d’analyse de données à réaliser ni besoin de chercher des corrélations ou tendances dans les données.

Les chercheurs en IA se sont mis en tête d’améliorer ces outils de base avec les dernières technologies d’IA et espèrent créer des systèmes désormais capables d’aider les humains à lire, écrire et parler. Le domaine de recherche en IA sur ce sujet est appelé traitement du langage naturel (natural language processing en anglais).

Deux usages du mot "pied" : sur la gauche, le mot fait référence à l'unité de mesure tandis que sur la droite, le mot est utilisé pour parler de la partie du corps.

L’un des défis des systèmes d’IA dans ce domaine est d’apprendre comment un texte est structuré. En triant de grandes quantités de texte et en analysant les mots qui apparaissent les uns à côté des autres, ceux employés dans des contextes mélioratifs ou péjoratifs, ceux qui expriment le bonheur ou la tristesse, le sérieux ou l’humour, le système d’IA peut identifier des signaux faibles, les tendances présentes dans la langue française.

Il peut ensuite le faire pour d’autres langues et ainsi apprendre à traduire correctement le sens et le contexte spécifiques d’une langue à l’autre. Chaque mot, phrase et contexte contribue à la capacité du système d’IA à prédire quels mots doivent suivre dans une séquence et quels mots et phrases composent une traduction correcte.

Tout comme les humains, les systèmes d’IA commencent par les bases de la langue et apprennent donc d’abord à traduire mot par mot. Plus ils traduisent, plus ils développent progressivement la capacité de comprendre le contexte, la structure et le sens.

Cela engendre une question philosophique à laquelle nous devons réfléchir. Pouvons-nous réellement appeler un système d’IA « intelligent », ou ce système apprend-il simplement à imiter l’intelligence ? « Comprend-il » les mots qu’il utilise, ou répète-t-il simplement des constructions linguistiques qu’il pense appropriées dans une situation donnée ?

En observant de très nombreux textes et en trouvant quels mots sont souvent associés, les systèmes d’IA peuvent développer des capacités impressionnantes. Une fois qu’un système a appris quels mots sont employés dans tel ou tel contexte, il peut vérifier l’orthographe de votre texte et suggérer des synonymes.

Il peut par exemple améliorer vos documents professionnels en suggérant des mots plus soutenus ou plus impactants pour des publications sur les réseaux sociaux. Ces systèmes d’IA peuvent traduire du texte dans des centaines de langues différentes, et ils peuvent le faire plus rapidement et plus précisément que n’importe quel humain.

Ce sont ces mêmes systèmes d’IA qui sont utilisés pour améliorer les performances des chatbots sur les sites Internet aidant les utilisateurs à éviter des longs et potentiellement pénibles avec un centre d’appels. Ils permettent aussi à Alexa, Siri et d’autres assistants numériques de mieux comprendre nos demandes.

De tels systèmes peuvent non seulement traduire du texte en anglais courant, mais ils sont aussi capables de cibler différents styles, comme par exemple du William Shakespeare, ou du Jean-Jacques Rousseau.

A partir de là, il n’y a qu’un petit pas à franchir pour qu’un système d’IA puisse créer un roman de toutes pièces. D’ici peu, un système d’IA pourra probablement écrire le prochain roman de la saga Harry Potter, dans le style de Shakespeare, et le lire avec la voix de Barack Obama.

Et quand cela arrivera, comment considérerons nous l’intelligence artificielle par rapport à la nôtre ? Les philosophes ont du pain sur la planche…

Comment l’IA apprend à voir et à dessiner

Un autre aspect important de l’intelligence, qui ne se limite pas exclusivement aux humains, est la capacité de voir et de reconnaître des objets. Jusqu’à très récemment, les programmes informatiques avaient beaucoup de difficultés à différencier des images de chats de celles de chiens. C’est quelque chose de très facile pour les humains: même les enfants sont capables de faire la différence après avoir vu quelques images.

Mais ce problème d’identification visuelle n’est pas aussi simple qu’il n’y paraît. Il faut d’abord identifier les caractéristiques spécifiques qui, selon nous, nous aideront à distinguer un chat d’un chien. Cela peut se faire en observant la forme ou l’emplacement des yeux, des oreilles ou du museau. Nous pourrions aussi observer la posture de l’animal, sa façon de s’asseoir ou de se tenir debout.

Mais comment traduire cela dans un programme informatique ? Comment le programme pourra-t-il identifier l’animal dans une image et le distinguer de l’arrière-plan ? Comment placera-t-il ses yeux, ses oreilles ou son museau ?

Ce sont des problèmes que nous devons résoudre avant même de pouvoir désigner une image comme « ressemblant à un chat » ou ressemblant à un chien ». Écrire un tel programme du début à la fin n’est pas un exercice facile.

Les progrès récents de l’apprentissage profond (deep learning), l’un des domaines de la recherche sur l’IA, ont donné aux systèmes d’IA des capacités d’identification visuelle beaucoup plus précises qu’auparavant. Une fois de plus, la clé de cette avancée est la capacité de l’IA à traiter des millions d’images, à rechercher des modèles d’information cachés et à attribuer un petit paramètre à chacun d’entre eux.

Par exemple, un système d’IA peut apprendre à détecter les rayures sur une image, et en conclure qu’il peut s’agir de l’image soit d’un tigre ou d’un zèbre. Il peut également chercher des changements de couleur dans une même image: par exemple la présence de vert en bas et de bleu en haut a tendance à représenter la terre et le ciel.

La force des approches du deep learning tient dans le fait que le guidage humain n’est pas nécessaire car le système d’IA peut apprendre par lui-même quelles informations il doit rechercher. Grâce à cette autonomie, les systèmes d’IA produisent des résultats très intéressants en très peu de temps.

Après avoir fourni à une IA des millions d’images représentant 1’000 objets différents, les chercheurs ont regardé le type de schéma recherché par l’IA et ont trouvé l’image suivante:

AlexNet

Des motifs que le modèle d'IA "AlexNet" a réussi à retrouver dans les images. Chaque carré représente un motif (ou une caractéristique) que le modèle recherche dans les images. On peut reconnaître que les motifs des premières lignes sont sensibles aux lignes et diagonales tandis que les dernières lignes traduisent plutôt des changements de couleurs. Image empruntée à Krizhevsky, Sutskever, & Hinton (2017).

Cette image ne signifie peut-être pas grand-chose pour nous, mais elle explique comment le système d’IA considère les choses. Il observe les lignes horizontales et verticales d’une image, ainsi que tous les éléments présents entre ces lignes. Il recherche des couleurs spécifiques et comment elles ont tendance à passer de l’une à l’autre.

C’est extrêmement similaire à ce qui se passe dans notre cortex visuel, la région du cerveau responsable de la perception visuelle. Cela fait déjà plusieurs dizaines d’années que les neuroscientifiques savent que les cerveaux humains ont des régions dédiées à la recherche de lignes horizontales et verticales similaires, de changements de couleur, etc. Ces systèmes d’IA imitent donc les processus naturels et sans consigne humaine spécifique.

Une fois que le système d’IA a détecté suffisamment de modèles dans différentes parties de l’image, il apprend à les combiner pour reconnaître des traits tels que les yeux, les oreilles et le museau. Puis il peut déduire de la façon dont ces traits sont dessinés si l’image est vraisemblablement celle d’un chat ou d’un chien.

AlexNet

Tout comme dans l'image précédente, cette illustration nous montre les différents motifs que les modèles d'IA cherchent dans les photos. En combinant tous ces motifs, un modèle d'"apprentissage profond" peut ainsi détecter des formes basiques (à gauche), avancées (au milieu) voir complexes (à droites) comme un oeil, une roue, un oiseau. Cette illustration a été empruntée au "Deep Learning Tutorial" de Yann Le Cun et Marc'Aurelio Ranzato et est une adaptation du papier de recherche de Zeiler & Fergus (2014).

En observant de nombreuses images, l’IA identifie les meilleurs paramètres internes pour l’aider à rendre ces déductions fiables. En d’autres termes, elle apprend et devient par conséquent capable de « voir ».

Pendant très longtemps, les ordinateurs étaient incapables d’identifier des images. Ce n’est qu’en 2012 que Google a finalement développé un programme permettant d’affirmer de manière définitive si une image représentait un chat ou un chien.1 Ce système d’IA avait des capacités similaires à celles d’un jeune enfant et était capable d’effectuer des tâches simples avec une précision acceptable.

Il n’a ensuite fallu que 5 ans pour que les systèmes d’IA développent la capacité de créer de fausses vidéos, parfois appelées « deepfakes » (« hypertrucages » en français) où le visage d’une personne dans une image ou une vidéo peut être remplacé de manière convaincante par celui de quelqu’un d’autre.2 Les “deepfakes” peuvent atteindre un degré de détail et de perfection que la plupart des humains ne pourraient pas atteindre, même avec des années d’expérience sur un programme de création et de retouche photo tel que Photoshop.

Les systèmes d’intelligence artificielle ont depuis développé la capacité de détecter la présence d’un cancer sur une radiographie avec une précision beaucoup plus grande que la plupart des radiologues professionnels.3 Ces différentes tâches sont exécutées grâce aux mêmes processus technologiques, consistant à rechercher des modèles dans les images et à ajuster les paramètres pour obtenir le résultat souhaité.

Et bien sûr, les progrès ne se sont pas arrêtés là. Les systèmes d’IA sont récemment devenus beaucoup plus efficaces dans l’utilisation des motifs qu’ils identifient dans les photos. Les “deepfakes” en sont un bon exemple. Une fois que les systèmes d’IA savaient détecter les visages et les caractéristiques d’une photo donnée, ils pouvaient utiliser ces informations pour générer des visages artificiels entièrement nouveaux.

Pour voir un exemple de flux sans fin de visages artificiels, allez sur la page thispersondoesnotexist.com et actualisez-la autant de fois que vous le voulez.4 Ces images de visages sont entièrement générées artificiellement, comme le nom de la page l’indique: « cette personne n’existe pas ».

Maintenant que les systèmes d’IA peuvent détecter un objet spécifique dans une image, ils peuvent créer une nouvelle version de l’image sans cet objet. Ces nouveaux systèmes sont donc capables de supprimer les éléments indésirables sur des photos de vacances ou de mariage. Des passants, des touristes, une tache sur votre t-shirt ou bien un oiseau au loin, tous ces éléments peuvent être supprimés en un clic pour créer l’image parfaite.5

Ces systèmes seront bientôt en mesure de modifier automatiquement vos photos de vacances, de créer des tableaux imitant le style de votre artiste préféré6 et même de créer de nouveaux épisodes de votre émission de télévision favorite dans un laps de temps très court.

Comment allons-nous envisager la nature de l’intelligence, de la créativité et de l’imagination lorsque tout cela deviendra possible ?

Comment l’IA apprend à décider, à échouer et à apprendre à nouveau

Dans les exemples précédents sur la lecture et la visualisation, nous avons vu comment les systèmes d’IA analysent de grandes quantités de données, identifient des schémas d’information, puis affinent de nombreux paramètres pour prédire un résultat.

Plus simplement, l’IA apprend le sens de certains mots ou objets. En d’autres termes, ces systèmes apprennent le « sens » de ces modèles et cet apprentissage est très similaire à celui des humains à l’école. Nous apprenons le sens des lettres et des objets, ce qu’ils représentent, et ce à quoi ils ressemblent afin de pouvoir les reconnaître plus tard.

Mais nos vies ne sont pas structurées autour de schémas bien ordonnés et nos expériences ne se répètent que rarement de la même façon. Nous développons la plupart de nos connaissances et de nos compétences en dehors des salles de classe, dans nos interactions avec le monde. Ce qui compte vraiment ici, ce n’est pas ce qu’un objet représente, mais la façon dont nous interagissons avec lui et les conséquences de cette interaction.

Par exemple, quel est le trajet le plus rapide pour se rendre au travail ? Devriez-vous y aller en voiture ou plutôt à vélo ? Quel temps fait-il ? Si vous êtes déjà en retard pour aller au travail, devez-vous compromettre votre sécurité en décidant de ne pas mettre votre casque ? Ces 30 secondes gagnées en valent-elles vraiment la peine ? Ce type de considérations et de compromis nous aident dans nos processus de décision.

Le développement de systèmes d’IA capables de prendre plusieurs décisions successives est un domaine de recherche en IA appelé l'apprentissage par renforcement (reinforcement learning). Ces systèmes d’IA sont placés dans des environnements où ils peuvent interagir et prendre des décisions et, en fonction des actions qu’ils prennent, ils sont soit récompensés soit punis. Ils apprennent donc le bon comportement par renforcement.

Prenons un exemple. Imaginez un parc au milieu d’une ville, avec quelques arbres et un oiseau cherchant quelque chose à manger. L’oiseau est ici « l’acteur » (parfois aussi appelé « l’agent ») essayant de trouver le moyen le plus rapide de manger quelque chose. Il peut parcourir le parc (« l’environnement ») pour trouver de la nourriture, et donc se retrouver dans diverses situations.

L’oiseau décide finalement de se poser et de chercher de la nourriture au sol, mais il est attaqué par un chat. Il survit à l’attaque, mais apprend que sa décision de passer trop de temps posé au sol a créé une situation dans laquelle il a failli être mangé. Il décide donc à l’avenir de passer plus de temps en vol, là où il est plus en sécurité.

Cependant, dans un autre scénario, il trouve un vendeur de hot-dog dans un coin du parc et découvre de nombreuses miettes sur le sol à proximité. Dans cette situation, il apprend que passer du temps à côté d’éléments entourés d’êtres humains est une bonne idée qui apporte des récompenses.

Les systèmes d’IA avec apprentissage par renforcement sont développés exactement de la même manière. Ces systèmes sont des acteurs dans des environnements donnés qui prennent des décisions fondées sur des expériences passées. Ils observent les résultats et apprennent quelles actions engendrent des récompenses ou des punitions.

Ce type de système d’IA est assez différent des deux autres systèmes que nous avons vus précédemment. Dans les exemples précédents, les systèmes d’IA recevaient des données à examiner afin de pouvoir identifier des schémas d’information. Dans l’apprentissage par renforcement, le système d’IA crée ses propres données en étant acteur dans un environnement donnant des récompenses ou des punitions. C’est en essayant, en échouant, et en essayant à nouveau que ces systèmes d’IA apprennent à prendre de meilleures décisions en fonction de leurs propres expériences.

L’apprentissage par renforcement est un domaine encore relativement nouveau dans la recherche en IA et il n’existe pas beaucoup de systèmes qui utilisent cette approche dans notre vie quotidienne. En effet, même les systèmes d’apprentissage par renforcement de base ont besoin de milliers d’essais et d’erreurs dans un environnement contrôlé pour fonctionner. Ces environnements sont longs à élaborer et à simuler, et les progrès sont donc plus lents comparés à ceux d’autres systèmes d’IA. Ce domaine de recherche est toutefois très prometteur car il ressemble à la façon dont les humains se comportent dans des environnements et apprennent à prendre des décisions.

La technologie d’apprentissage par renforcement a été à l’origine de certaines des avancées les plus spectaculaires de l’IA ces dernières années. C’est via celle-ci par exemple qu’un système a pu apprendre à jouer à plusieurs jeux vidéo Atari. Simplement grâce aux pixels de l’écran !7 L’apprentissage par renforcement était également la technologie clé utilisée par AlphaGo, l’algorithme DeepMind de Google qui, en 2016, a battu quatre fois sur cinq le champion du monde de Go.8

La même équipe a récemment utilisé l’apprentissage par renforcement pour construire AlphaFold, un programme d’IA qui a résolu en 2020 un problème de biologie vieux de 50 ans.9 Les systèmes d’apprentissage par renforcement sont également beaucoup utilisés en robotique et chez des drones automatisés, deux cas dans lesquels des milliers d’essais peuvent être menés en toute sécurité dans des environnements contrôlés.

Plus proche de chez nous, les CFF ont récemment lancé un concours appelé le défi “Flatland”. Il s’agit d’un concours ouvert à tous qui encourage les gens à utiliser l’apprentissage par renforcement afin de trouver la meilleure solution pour gérer le trafic sur des réseaux ferroviaires complexes.

En résumé

À l’heure actuelle, les technologies d’IA sont capables de lire et d’écrire sans toutefois vraiment comprendre le sens des mots. Elles peuvent voir et dessiner sans vraiment comprendre ce que les formes et les éléments d’une image représentent réellement. Et elles peuvent prendre des décisions en essayant et en échouant sans être réellement vivantes.

Le fait que ces activités signifient ou non que l’IA est dotée de raison, intelligente ou même créative est une discussion philosophique à avoir. Nous espérons surtout que cet article vous a permis de comprendre les mécanismes invisibles des systèmes d’IA, et le fait que leurs capacités peuvent être expliquées par des processus entièrement clairs et rationnels.

  1. Pour en savoir plus, vous pouvez visiter l’article de blog de Google (en anglais) qui relate cette percée ou encore cet article de www.wired.com (en anglais). 

  2. Pour en savoir plus sur les deepfakes, l’article Wikipédia sur le sujet pointe vers des ressources intéressantes dont une vidéo. Le préfixe “deep” dans “deepfakes” fait référence au fait que ces images sont générées via du “deep” learning (apprentissage profond). 

  3. L’étude qui présente ces impressionnants résultats a été publiée dans le journal Nature et peut être consultée ici

  4. Le lecteur curieux pourra aussi aller voir des faux chats ou des faux chevaux

  5. Pour voir cette technologie à l’œuvre, regardez cette vidéo YouTube

  6. On appelle cette technique le “transfert de style”. Vous pouvez en savoir plus en lisant cet article (en anglais) qui décrit en détail cette approche. 

  7. La publication scientifique de ce résultat se trouve ici (en anglais). 

  8. Pour en savoir plus sur le duel AlphaGo contre Lee Sedol, vous pouvez visiter cet article Wikipedia ou la page officielle du projet (en anglais). 

  9. Pour en savoir plus sur AlphaFold, vous pouvez visiter cet article Wikipedia (en anglais) ou la page officielle du projet (en anglais). 

Prochain

L'histoire de l'IA