De Deep Blue à ChatGPT : L'Évolution de l'IA

Mai 1997. New York. Le champion du monde d’échecs Garry Kasparov se lève brusquement de sa chaise, le visage décomposé. Il vient de perdre contre une machine. Deeper Blue, le superordinateur d’IBM, a gagné. À cet instant précis, le monde entier pense que l’intelligence artificielle a atteint son apogée.

Pourtant, si vous aviez demandé à Deeper Blue de vous raconter une blague ou de résumer un article de journal, il serait resté muet. C’était un génie idiot, un savant monomaniaque.

Avance rapide jusqu’à aujourd’hui. Vous discutez avec ChatGPT. Il écrit des poèmes, code des sites web et vous explique la physique quantique avec des émojis. Mais paradoxalement, il est bien moins “logique” que son ancêtre de 1997.

Comment sommes-nous passés d’une calculatrice géante imbattable aux échecs à un assistant créatif capable de converser ? Ce voyage n’est pas seulement une histoire de technologie, c’est l’histoire d’un changement radical de philosophie : nous avons arrêté d’essayer d’apprendre aux machines quoi penser pour leur apprendre comment apprendre.

Le Problème : La limite de la force brute

Pour comprendre pourquoi l’IA moderne (comme ChatGPT) est une rupture et non une simple amélioration, il faut comprendre l’impasse dans laquelle nous étions.

Pendant des décennies, l’IA reposait sur une approche symbolique et déterministe. C’était l’ère des “systèmes experts”. L’idée était simple : pour qu’une machine soit intelligente, des humains devaient coder manuellement toutes les règles de l’intelligence.

L’illusion de l’intelligence

Deep Blue (et son successeur Deeper Blue) n’était pas “intelligent” au sens où nous l’entendons. Il ne comprenait pas le jeu d’échecs. Il ne ressentait pas la pression. Il utilisait ce qu’on appelle la force brute.

Imaginez que vous cherchiez la sortie d’un labyrinthe :

L’humain (Kasparov) utilise son intuition, reconnaît des motifs (“ce couloir ressemble à celui de tout à l’heure”) et planifie une stratégie.
La machine (Deep Blue) envoie des millions d’éclaireurs virtuels dans toutes les directions possibles simultanément, calcule quel chemin mène à la victoire, et choisit celui-là.

C’est efficace pour un jeu aux règles fermées comme les échecs. Mais le monde réel n’est pas un échiquier. Le langage humain, par exemple, n’a pas de règles strictes et immuables. Il est fait de nuances, de sous-entendus et de contexte. Vous ne pouvez pas coder toutes les règles d’une conversation “à la main”. C’est pour cela que les chatbots des années 60 comme ELIZA, ou même les assistants vocaux des années 2010, échouaient lamentablement dès qu’on sortait du script.

Comment ça Marche : Le changement de paradigme

Le passage de Deep Blue à ChatGPT est comparable à l’évolution de la pédagogie.

L’Analogie de la Bibliothèque et de l’Étudiant

Pour visualiser cette transition technique, utilisons une analogie :

L’IA Symbolique (Deep Blue) est une bibliothèque mécanisée. Elle contient des millions de livres (positions d’échecs) et un bras robotique ultra-rapide capable de trouver le livre exact en une milliseconde. Si la situation est dans le livre, la machine est parfaite. Si la situation est nouvelle, la machine plante. Elle ne comprend pas ce qu’elle lit.
L’IA Générative (ChatGPT) est un étudiant surdoué. Il a lu toute la bibliothèque. Il ne se souvient pas de chaque phrase par cœur (il n’a pas la précision de la bibliothèque), mais il a compris les concepts. Il a assimilé la structure du langage, les styles d’écriture et les liens logiques. Si vous lui posez une question inédite, il peut générer une réponse probable en se basant sur ce qu’il a appris.

La chronologie de la rupture

Ce changement ne s’est pas fait en un jour. Voici les étapes clés qui ont permis de passer du calcul à l’apprentissage :

L’Hiver de l’IA (1997-2010) : Après la victoire de Deep Blue, l’enthousiasme retombe. On réalise que la force brute coûte trop cher et ne s’adapte pas. Les chercheurs travaillent dans l’ombre sur les “réseaux de neurones”, une technique inspirée du cerveau humain, alors boudée par l’industrie.
Le carburant des données (Big Data) : Avec l’explosion d’Internet, nous avons commencé à générer des quantités astronomiques de données (textes, images). C’était la nourriture dont les réseaux de neurones avaient besoin.
Le moteur matériel (GPU - 2010) : Les cartes graphiques, initialement prévues pour les jeux vidéo, se révèlent parfaites pour les calculs matriciels de l’IA. Soudain, on a la puissance nécessaire pour entraîner ces réseaux.
Le déclic (2012) : Google entraîne une IA à regarder YouTube. Sans aucune instruction, l’IA apprend seule à reconnaître un chat. C’est la naissance du Deep Learning moderne. La machine ne suit plus de règles, elle les découvre.
La maîtrise de l’intuition (AlphaGo - 2016) : DeepMind crée AlphaGo. Contrairement aux échecs, le jeu de Go a trop de possibilités pour la force brute. AlphaGo utilise l’apprentissage par renforcement (il joue contre lui-même des millions de fois). Il développe une forme “d’intuition”, jouant des coups qu’aucun humain n’avait imaginés.
L’ère générative (Transformers - 2017+) : L’architecture “Transformer” permet aux IA de traiter le langage non plus mot à mot, mais en comprenant les relations contextuelles globales. C’est la base de GPT (Generative Pre-trained Transformer).

Visualiser l’architecture

Voici comment la logique de traitement a évolué. Notez la disparition des “Règles Humaines” au profit de l’Entraînement.

flowchart LR
    subgraph DeepBlue ["Ère Symbolique (Deep Blue)"]
        A[Données d'entrée] --> B{Règles codées par Humains}
        B --> C[Calcul de Force Brute]
        C --> D[Réponse Déterministe]
    end

    subgraph ChatGPT ["Ère Connexionniste (ChatGPT)"]
        E[Données Massives] --> F[Entraînement Réseau de Neurones]
        F --> G[Modèle de Langage - Boîte Noire]
        H[Prompt Utilisateur] --> G
        G --> I[Réponse Probabiliste Générée]
    end

    style DeepBlue fill:#e1f5fe,stroke:#01579b
    style ChatGPT fill:#f3e5f5,stroke:#4a148c

Applications Concrètes

La différence technique engendre une différence radicale dans l’utilisation. On ne demande pas la même chose à un calculateur et à un créatif.

L’Approche Deep Blue (Calcul)

Cas d’usage : Résoudre une fin de partie d’échecs avec 7 pièces.
Méthode : L’ordinateur calcule toutes les variantes possibles jusqu’au mat. C’est une vérité mathématique absolue.
Limite : Impossible à appliquer au poker (information cachée) ou à la négociation diplomatique.

L’Approche ChatGPT/AlphaGo (Intuition)

Cas d’usage : Gagner au Go ou au Poker, écrire un scénario de jeu de rôle.
Méthode : L’IA évalue la probabilité de succès d’une action basée sur son expérience passée (“ce type de mouvement mène souvent à la victoire”).
Avantage : Capable de bluff, de créativité et d’adaptation à l’inconnu.

L’Approche “Ancien Chatbot” (Mots-clés)

Fonctionnement : Si le client écrit “remboursement”, afficher la page /remboursement.
Résultat : Frustrant. Si vous dites “Je ne veux pas un remboursement mais un échange”, le bot voit le mot “remboursement” et vous envoie au mauvais endroit.

L’Approche LLM (Contexte)

Fonctionnement : L’IA analyse la sémantique de la phrase entière. Elle comprend la négation et l’intention.
Résultat : Une conversation fluide qui peut gérer des demandes complexes et nuancées, voire détecter l’ironie (parfois).

Les Pièges à Éviter

Cette transition vers l’IA générative crée de nouveaux risques. Nous avons troqué la rigidité contre l’incertitude.

Le piège le plus courant est de traiter ChatGPT comme s’il était Deep Blue.

L’Hallucination : Deep Blue ne pouvait pas se tromper dans son calcul (sauf bug). ChatGPT, lui, est une machine à prédire le mot suivant le plus probable. Si le mot le plus probable est factuellement faux, il l’écrira quand même avec aplomb. Il privilégie la cohérence linguistique sur la vérité factuelle.
L’Inconstance : Posez la même question deux fois à Deep Blue, vous aurez deux fois la même réponse. Posez-la à ChatGPT, la réponse peut varier. C’est un système probabiliste, non déterministe.
L’Effet ELIZA : Parce que ces modèles manient le langage humain à la perfection (mieux qu’ELIZA en 1966), nous avons tendance à leur attribuer une conscience, des émotions ou une intention. C’est de l’anthropomorphisme. ChatGPT ne “veut” pas vous aider, il complète statistiquement un pattern.

À Retenir

L’évolution de l’IA n’est pas linéaire, c’est un changement d’espèce technologique.

De la Déduction à l’Induction : Nous sommes passés de systèmes où l’humain dictait les règles (Deep Blue) à des systèmes où la machine déduit les règles à partir des données (Machine Learning).
La Victoire de la Probabilité : L’IA moderne ne cherche pas la réponse “vraie” au sens mathématique, mais la réponse la plus “probable” statistiquement.
La Polyvalence : Les anciens systèmes étaient des experts ultra-spécialisés (échecs, diagnostic). Les nouveaux modèles (LLM) sont des généralistes capables de transférer des compétences d’un domaine à l’autre.
L’Opacité : Avec Deep Blue, on pouvait tracer la logique de chaque décision. Avec le Deep Learning, le cheminement de la “pensée” de l’IA est souvent une boîte noire, même pour ses créateurs.
Le Matériel comme Moteur : Cette révolution a été rendue possible autant par l’évolution des algorithmes que par la puissance brute des GPU et la disponibilité massive des données.

Notions Liées

Pour approfondir votre compréhension de cette évolution :

Machine Learning : Comprendre le mécanisme d’apprentissage qui a remplacé les règles fixes.
Test de Turing : L’expérience de pensée originelle d’Alan Turing (1950) qui a défini l’objectif de l’IA conversationnelle.
Hallucinations : Pourquoi les modèles génératifs inventent des faits et comment gérer ce risque.
Réseaux de Neurones : L’architecture technique qui imite le cerveau et a permis le Deep Learning.