Comprendre l'Intelligence Artificielle
Qu'est-ce que l'IA ?
L'Intelligence Artificielle est un domaine de l'informatique qui tente de faire simuler par une machine l'une des formes de l'intelligence humaine basée sur l'apprentissage et le raisonnement.
On considère que dans le domaine de l'IA tel qu'il est actuellement (ce cours est écrit à l'automne 2025), on utilise 3 axes principaux :
L'apprentissage
Les IA engloutissent des volumes énormes de données afin de reconnaitre des schémas similaires. Un exemple typique est d'envoyer à une IA des dizaines de milliers d'images de pommes et d'oranges jusqu'à ce que sa capacité de reconnaissance soit telle qu'elle puisse identifier à coup sûr l'un ou l'autre fruit.
Le raisonnement
Une fois ces schémas étudiés, mémorisés et parfaitement intégrés, l'IA va tenter de tirer des conclusions des immenses volumes de données à sa disposition. Soit pour analyser à posteriori soit pour tenter de prédire des conséquences possibles.
L'autorégulation
En fonction des retours, l'IA va tenter de réguler ses propres conclusions et analyses pour en quelque sorte "apprendre de ses erreurs" ou adapter son analyse et sa réponse au résultat "attendu".
Dans une moindre mesure (l'IA ne pouvant pas bénéficier de stimuli physiques et ayant des capacités d'interactions avec le monde plus bridées) on peut imaginer un parallèle entre ce mode d'apprentissage par la répétition jusqu'à l'assimilation aux formes d'apprentissage des jeunes enfants.
On estime que la comparaison entre les modes d'apprentissage de l'IA et des humains s'arrête actuellement aux alentours du mode d'apprentissage d'un enfant de 2 à 5 ans, l'IA échouant à la plupart des tests de raisonnements cognitifs des enfants de 7 ans. (source : Transmission Versus Truth, Imitation Versus Innovation: What Children Can Do That Large Language and Language- and-Vision Models Cannot (Yet)).
Comment fonctionnent les IA modernes ?
Les Intelligences Artificielles actuelles reposent sur des réseaux neuronaux qui utilisent l'architecture Transformer.
Les réseaux neuronaux
Les réseaux neuronaux sont un principe logiciel qui tente d'émuler le fonctionnement des neurones dans le cerveaux humain. Un réseau est composé de millions voire de milliards de neurones artificiels connectés entre eux et disposés dans des couches.
Chaque connection entre deux neurones a un poids et lors de la phase d'apprentissage du réseau c'est en ajustant ses poids qu'il apprend à reconnaître les schémas et récurrences.
Le modèle transformer
La révolution que l'on observe actuellement de la performance des IA est largement basée sur l'adoption d'un modèle de fonctionnement des réseaux neuronaux appelé Transformer.
L'un des grands changements apportés par ce modèle est de concentrer le fonctionnement sur le principe d'attention qui permet de traiter tous les éléments de la phase d'entrée de façon parallèle. Cela permet aux modèles d'être immensément plus rapides et de limiter la perte des premiers "tokens" de la conversation ce qui était un des principaux défauts des modèles précédents.
À quoi sert l'IA ?
L'IA a actuellement de nombreux domaines d'application et nous allons en détailler quelques-uns.
La génération de contenu
C'est probablement son champ d'application actuel le plus exposé et le plus visible. L'IA, grâce aux LLM (Large Language Models) sur lesquels sont basés des solutions comme ChatGPT ou Claude, permet de générer des contenus de différentes natures.
Générer du texte
Les IA permettent de générer à la fois du contenu de texte (si vous avez passé un peu de temps sur LinkedIn récemment vous avez pu le constater par vous-même), des résumés et synthèses d'articles ainsi que des scripts.
Générer des contenus multimédias
Certaines solutions permettent de générer des contenus images ou vidéos avec différents niveaux de réalisme et de complexité depuis une description simple (un prompt).
Automatisation des tâches
Cette capacité à générer du contenu lui permet également d'automatiser certaines tâches qui nécessitent de générer du texte comme la traduction automatique ou le sous-titrage automatique de contenus vidéos.
La recherche scientifique
L'IA permettant d'analyser rapidement d'énormes volumes de données, elle est utilisée notamment en biologie et en médecine.
Diagnostic médical
Sa capacité de traitement de l'image et du signal lui permet d'être un outil de soutien diagnostic.
Recherche pharmaceutique
En permettant de simuler des combinaisons de molécules et d'interactions moléculaires, l'IA permet d'accélérer la recherche de nouveaux médicaments.
Opérations de précision
Certains robots chirurgicaux qui nécessitent une grande précision sont parfois contrôlés par l'IA qui obtient une précision difficile à atteindre par la manipulation purement humaine par exemple ce projet français autour des chirurgies de la colonne vertébrale.
Secteurs financiers et bancaires
Dans les secteurs financiers et bancaires l'IA intervient principalement pour la sécurité et la gestion / analyse des risques.
Détection de la fraude
L'IA permet une surveillance en quasi temps réel de toutes les transactions pour y repérer les anomalies et fraudes potentielles.
Analyse du risque
L'IA a pris le relais de nombreux questionnaires qui permettaient pour les établissements bancaires d'évaluer les risques au moment d'accorder des crédits.
Le développement
Dans nos métiers aussi, l'IA prend une place qui va en grandissant, tant pour produire du code que pour accompagner les projets ou épauler les professionnels.
Génération de code
L'IA permet depuis un prompt simple de générer du code dans à peu près n'importe quelle technologie.
Automatisation de tâches
L'IA permet l'automatisation de nombreuses tâches, par exemple liées aux tests ou aux tâches administratives liées au code, notamment des synthèses de code review, de la veille sur les nouvelles versions des dépendances ou le reporting des performances applicatives.
Les limites de l'IA
Malgré des capacités très impressionnantes l'IA a aussi de nombreuses limites.
La relation de causalité
L'IA est excellente pour repérer des schémas et des répétitions (pattern recognition) mais elle est actuellement incapable de comprendre une relation de causalité. Elle peut effectuer des rapprochements statistiques (corrélation) mais est incapable de comprendre qu'un phénomène cause (ou pas) un autre phénomène.
L'IA peut également "halluciner" une relation de causalité. Si par exemple elle observe que les cas de noyades à la plage augmentent de façon significative lorsque la consommation de glaces augmente, l'IA pourrait en déduire que la consommation de glaces cause des noyades, alors que ces deux phénomènes ont en réalité une cause commune : c'est l'été et il fait chaud.
Manque d'autonomie
L'IA telle qu'elle existe actuellement n'a pas d'autonomie dans son apprentissage :
Dépendance aux données
Elle nécessite d'énormes volumes de données qui doivent être recueillis et lui être fournis. Elle ne peut pas aller chercher d'elle-même de nouvelles sources de données et se trouve donc extrêmement dépendante des données qui lui ont été fournies. Cela veut également dire que si les données sont biaisées, l'IA le sera également. L' Algorithmic Justice League et Joy Buolamwini ont publié de nombreux articles sur les biais racistes de l'IA.
Dépendance à l'humain
Malgré une automatisation qui s'accentue, l'IA a toujours énormément besoin d'intervention humaine pour préparer et indexer les données puis pour lui fournir le feedback nécessaire sur ses travaux ainsi que pour filtrer ses réponses.
Pas de transparence
Dans les systèmes actuels basés sur le Deep Learning, un modèle est totalement incapable d'expliquer pourquoi il a donné une réponse précise. Il est incapable de détailler son processus de décision, ce qui pose des problèmes de transparence dans les cas de justice ou de médecine.
Les enjeux éthiques
Enjeux économiques
Les coûts très élevés des Large Language Models
Les LLM ont des coûts très élevés tant pour l'entraînement des modèles (on estime à 5M
À ce coût d'entraînement vient s'ajouter le coût de chaque requête, qui, s'il chiffre dans les centimes par requête s'additionne très vite tant le volume de requêtes quotidien est élevé (estimé à plusieurs centaines de millions par jour en janvier 2023 et qui ne fait qu'augmenter depuis).
Ces coûts très élevés concentrent cette technologie dans les mains d'une poignée d'entreprises avec le risque de monopole que cela implique.
Le risque d'une "bulle IA"
Les investissements financiers massifs dans tout ce qui touche de près ou de loin à l'IA font craindre une bulle spéculative comparable à la bulle internet des années 2000. Si la situation est différente (cette nouvelle technologie a effectivement des fondements réels) les risques pour les marchés financiers sont tout aussi importants qu'ils l'étaient lors des dernières bulles spéculatives.
Vous trouverez une excellente vidéo explicative en français sur le sujet ici
Les craintes liées à la souveraineté économique
La plupart des grosses entreprises d'IA sont américaines que ce soit les LLM (OpenAI, Alphabet, Anthropic) ou les fournisseurs de Hardware (Nvidia, Amazon) sont américaines. Dans un contexte de tension grandissante et de refroidissement des relations diplomatiques et commerciales entre l'Union Européenne et les États-Unis, les craintes sur une dépendance grandissante à des puissances économiques étrangères s'accentuent.
Enjeux environnementaux
Consommation d'énergie
La consommation estimée pour une requête sur un modèle d'IA peut monter très vite :
Une requête de 400 tokens sur un modèle mini (GPT-4o mini par exemple) consomme environ 1.83Wh (l'équivalent de 3 minutes de vidéo en ligne).
Sur un modèle plus gourmand (Llama 3 par exemple) cette requête peut monter à 55Wh (l'équivalent d'une heure de vidéo en ligne).
Source : DRANE Versailles
Si l'on garde à l'esprit que plusieurs centaines de millions de ces requêtes sont effectuées chaque jour, le coût énergétique est immense.
Consommation d'eau
Pour faire tourner les serveurs des data-centers nécessaires pour l'IA (et le numérique en général) d' immenses quantités d'eau sont nécessaires. On estime qu'en 2027 les besoins d'eau de l'IA oscilleront entre 4 et 6 milliards de mètres cubes d'eau (4 à 6 fois la consommation d'un pays comme le Danemark).
À titre comparatif, l'agriculture française a consommé 3,4 millards de mètres cubes d'eau en 2020 (source gouvernement français).
Enjeux légaux
Propriété intellectuelle
Le fonctionnement actuel des IA pose un certain nombre de problèmes liés à la propriété intellectuelle :
Le droits d'auteur sur les données d'entraînement : les IA sont entraînées avec des corpus de milliards de documents qui sont parfois couverts par le droit d'auteur (articles, textes, photos, vidéos) et son usage opaque de ces données ne permet pas de savoir si le droit d'auteur est respecté.
Le droit d'auteur sur le contenu généré : il est actuellement difficile de statuer sur la propriété intellectuelle d'un contenu généré par l'IA. Considère t'on qu'il appartient à l'utilisateur à l'origine du prompt ? À l'entreprise propriétaire de l'IA ? Pourquoi pas à l'IA elle-même ?
La "régurgitation" : l'IA est incapable de déterminer précisément ce qui lui fait générer tel ou tel contenu ce qui lui fait parfois ressortir des blocs entiers de contenu issu de ses données d'entrainement. Si e contenu est trop dense ou trop semblable, alors la propriété intellectuelle de l'auteur d'origine n'est pas respectée.
La manipulation des IA
Les IA sont entrainées et modérées par des humains, elles sont donc très sensibles à l'influence de ces derniers qui sont toujours biaisés.
L'exemple le plus frappant est celui de Grok, l'IA de X/Twitter, créée, selon Elon Musk pour contrer les biais idéologiques "woke" de ses concurrents. Grok a de multiples fois été, de façon assumée, manipulée pour refléter les convictions de son propriétaire.
Même sans en arriver à des exemples aussi flagrants que Grok, différentes IA auront toujours des biais légèrement différents. Il existe certaines initiatives qui visent à utiliser plusieurs IA en parallèle pour pouvoir comparer leurs réponses : par exemple Comparia mis en place par le gouvernement français.