Vecteurs et Sens : L'Exemple Royauté, Masculinité, Comestible
Imaginez que vous deviez expliquer à une calculatrice la différence entre une pomme et un roi.
Pour vous, c’est évident. L’un se mange, l’autre règne. L’un pousse dans un arbre, l’autre vit dans un palais. Mais pour un ordinateur, “Pomme” et “Roi” ne sont que des suites de 0 et de 1, des chaînes de caractères sans âme. “Pomme” a 5 lettres, “Roi” en a 3. C’est à peu près tout ce que la machine perçoit.
Alors, comment ChatGPT, Google ou Netflix font-ils pour “comprendre” le sens des mots ? Comment savent-ils que “Reine” est proche de “Roi”, mais très éloigné de “Compote” ?
La réponse tient dans une astuce mathématique fascinante : nous transformons les mots en coordonnées GPS. Mais au lieu de la latitude et de la longitude, nous utilisons des axes conceptuels.
Bienvenue dans le monde vertigineux des espaces vectoriels, où nous allons imaginer ensemble trois axes invisibles : la Royauté, la Masculinité et le Comestible.
Le Problème : La barrière de la langue machine
Avant l’arrivée de l’IA moderne (le Deep Learning), les ordinateurs étaient des “idiots littéraux”. Si vous cherchiez “Monarque” dans une base de données, l’ordinateur cherchait la suite de lettres M-O-N-A-R-Q-U-E. S’il trouvait le mot “Roi”, il ne faisait aucun lien. Pour lui, c’était aussi différent que “Chaise” et “Nuage”.
C’est un problème majeur pour nous, professionnels.
- En droit, un contrat peut parler de “bailleurs” ou de “propriétaires”.
- En commerce, un client peut demander un “smartphone” ou un “téléphone portable”.
Si la machine ne comprend pas que ces mots partagent le même sens, elle échoue. Il fallait donc inventer un moyen de capturer l’essence d’un mot sous une forme numérique. Il fallait donner une “adresse” à chaque concept.
Comment ça Marche : La Carte du Sens
Pour comprendre comment l’IA “pense”, oubliez le code informatique et visualisez un graphique en 3 dimensions, comme un cube transparent flottant dans l’espace.
Pour placer nos mots dans ce cube, nous allons définir trois règles, trois échelles de mesure allant de 0 (pas du tout) à 1 (totalement).
1. L’Axe de la Royauté
Sur cet axe, nous mesurons à quel point un mot est lié au pouvoir monarchique.
- Roi : Score de 0.99 (C’est le concept même).
- Reine : Score de 0.99 (Tout aussi royal).
- Président : Score de 0.60 (C’est un chef d’état, mais pas un monarque).
- Paysan : Score de 0.05 (Historiquement lié, mais en bas de l’échelle).
- Pomme : Score de 0.00 (Aucun rapport politique).
2. L’Axe de la Masculinité
Ici, nous mesurons le genre associé au mot (dans une vision linguistique binaire traditionnelle pour simplifier le modèle).
- Roi : Score de 0.95 (Masculin).
- Reine : Score de 0.05 (Féminin).
- Homme : Score de 1.00.
- Femme : Score de 0.00.
- Pomme : Score de 0.50 (Neutre, ou non applicable).
3. L’Axe du Comestible
C’est ici que ça devient intéressant. Cet axe permet de distinguer les objets physiques consommables des titres sociaux.
- Pomme : Score de 0.98 (Très comestible).
- Pain : Score de 0.95.
- Roi : Score de 0.01 (Techniquement de la viande, mais socialement non comestible !).
- Reine : Score de 0.01.
Le Résultat : Le Vecteur
Maintenant, regardons comment l’ordinateur “voit” ces mots. Il ne voit pas les lettres, il voit une liste de trois chiffres (un vecteur).
| Mot | Royauté | Masculinité | Comestible | Le “Vecteur” (ce que voit l’IA) |
|---|---|---|---|---|
| Roi | 0.99 | 0.95 | 0.01 | [0.99, 0.95, 0.01] |
| Reine | 0.99 | 0.05 | 0.01 | [0.99, 0.05, 0.01] |
| Pomme | 0.00 | 0.50 | 0.98 | [0.00, 0.50, 0.98] |
Visualisation Simplifiée
Voici comment ces mots se placeraient sur un graphique 2D (si on ignorait l’axe comestible pour un instant) :
graph TD
subgraph "Espace Sémantique"
A((Roi))
B((Reine))
C((Homme))
D((Femme))
E((Pomme))
end
A <--> B
style A fill:#ff9999,stroke:#333,stroke-width:2px
style B fill:#ff9999,stroke:#333,stroke-width:2px
C <--> D
style C fill:#99ccff,stroke:#333,stroke-width:2px
style D fill:#99ccff,stroke:#333,stroke-width:2px
E -.-> A
linkStyle 4 stroke:red,stroke-width:2px,stroke-dasharray: 5 5;
Notez que la distance entre Roi et Reine est très courte sur l’axe “Royauté”, mais éloignée sur l’axe “Masculinité”. La Pomme, elle, flotte très loin de ce petit groupe.
La Magie de l’Arithmétique des Mots
C’est ici que le concept devient révolutionnaire. Puisque les mots sont des nombres, nous pouvons faire des mathématiques avec.
L’exemple le plus célèbre de l’histoire du traitement du langage naturel (NLP) est cette équation :
Roi - Homme + Femme = ?
Faisons le calcul avec nos axes simplifiés :
- Prenons le vecteur Roi :
[0.99, 0.95, 0.01](Royal, Masculin, Pas mangeable) - Soustrayons le vecteur Homme (qui représente la masculinité pure) : On enlève le score de masculinité.
- Ajoutons le vecteur Femme (qui représente la féminité) : On ajoute une composante féminine.
Le résultat mathématique nous donne un nouveau point dans l’espace. Si on regarde quel mot se trouve le plus près de ce nouveau point, on tombe sur… Reine.
L’IA a “compris” l’analogie sans qu’on lui explique la biologie ou la monarchie. Elle a simplement manipulé des vecteurs.
Applications Concrètes
Pourquoi est-ce utile pour votre entreprise ? Parce que cette technologie, appelée Embedding (ou plongement lexical), est le moteur sous le capot de presque toutes les applications d’IA modernes.
Le Problème : Votre intranet d’entreprise est nul. Vous tapez “procédure note de frais” et il ne trouve rien car le document s’appelle “Politique de remboursement des dépenses”.
La Solution Vectorielle : L’IA transforme votre requête “note de frais” en vecteur. Elle transforme le titre “remboursement des dépenses” en vecteur. Sur la carte du sens, ces deux vecteurs sont très proches (axe “Argent”, axe “Administratif”). Le moteur de recherche vous sort le bon document, même s’il ne contient pas les mots exacts que vous avez tapés. C’est la Recherche Sémantique.
Le Problème : Sur un site e-commerce, un client regarde un “Canapé en velours bleu”. Que lui proposer d’autre ?
La Solution Vectorielle : L’algorithme ne cherche pas juste le mot “Canapé”. Il analyse le vecteur du produit. Il trouve que ce vecteur est proche de “Coussin bleu nuit” (proximité de couleur et de style) ou de “Fauteuil art déco” (proximité de style). Il évite de proposer une “Chaise de jardin en plastique”, dont le vecteur est très éloigné sur l’axe “Luxe” et “Intérieur”, même si c’est aussi un siège.
Le Problème : Vous recevez 5000 emails par jour au support client. Il faut les trier entre “Urgent”, “Spam”, et “Demande technique”.
La Solution Vectorielle : L’IA vectorise chaque email. Elle remarque que tous les emails contenant des mots comme “panne”, “bloqué”, “erreur 404” se regroupent dans un coin de l’espace vectoriel. Elle trace une frontière autour de cette zone et dit : “Tout ce qui tombe ici est une Demande Technique”.
Les Pièges à Éviter : Les Biais Vectoriels
Si cette technologie est puissante, elle est aussi un miroir déformant de notre société. Les vecteurs sont créés en lisant des milliards de textes humains (internet, livres, articles). Ils apprennent donc nos stéréotypes.
À Retenir
Pour briller en réunion ou comprendre pourquoi votre moteur de recherche est devenu “intelligent”, gardez ces images en tête :
- Le GPS des Mots : L’IA transforme le langage en géométrie. Chaque mot a une adresse unique.
- Les Axes Invisibles : Ces adresses sont définies par des milliers de critères (Royauté, Genre, Comestible, Vitesse, Sentiment, etc.).
- La Proximité fait le Sens : Si deux points sont proches dans cet espace, les mots ont un sens similaire.
- L’Analogie Mathématique : On peut raisonner par calcul (A est à B ce que C est à D) grâce à ces vecteurs.
L’exemple “Royauté, Masculinité, Comestible” est une simplification pédagogique, mais il illustre parfaitement comment une machine, dépourvue de conscience, parvient à manipuler des concepts humains avec une précision redoutable.
Notions Liées
Pour approfondir votre compréhension de la “mécanique” de l’IA :
- Plongements Vectoriels (Embeddings) : L’article technique pour aller plus loin sur le fonctionnement mathématique.
- Tokenization : L’étape juste avant les vecteurs, comment on découpe les mots.
- RAG (Retrieval Augmented Generation) : La technique principale qui utilise ces vecteurs pour faire parler l’IA sur vos propres données.
- LLM (Large Language Model) : Le cerveau géant qui contient tous ces vecteurs.