Glossaire IA
Les termes essentiels, expliqués simplement.
Un système où le modèle ne se contente pas de répondre : il enchaîne des actions (chercher sur le web, exécuter du code, appeler des outils) en autonomie pour accomplir un objectif.
Intelligence artificielle générale : une IA hypothétique aussi compétente qu'un humain sur l'ensemble des tâches cognitives. Objet de débats intenses sur sa faisabilité et son horizon.
Test standardisé pour comparer les modèles entre eux (MMLU, HumanEval, etc.). Utile mais imparfait : les modèles peuvent être sur-optimisés pour les benchmarks.
Représentation d'un texte sous forme de vecteur de nombres qui capture son sens. Deux textes proches sémantiquement ont des embeddings proches — c'est la base de la recherche sémantique et du RAG.
La quantité maximale de texte (en tokens) qu'un modèle peut prendre en compte d'un coup : la conversation, les documents fournis, les instructions. Au-delà, il « oublie ».
Ré-entraîner un modèle existant sur des données spécifiques pour le spécialiser dans une tâche ou un domaine, plutôt que de repartir de zéro.
Processeur graphique, devenu le matériel clé de l'IA : l'entraînement et l'inférence des grands modèles tournent massivement sur GPU (Nvidia en tête), d'où les enjeux géopolitiques autour des puces.
Quand un modèle invente une information fausse avec assurance : un chiffre, une source, un fait. C'est le principal risque pratique des LLM — toujours vérifier les faits critiques.
La phase où le modèle est utilisé pour générer des réponses (par opposition à l'entraînement). Le coût d'inférence est ce qu'on paie quand on appelle une API d'IA.
Grand modèle de langage : une IA entraînée sur d'énormes volumes de texte pour comprendre et générer du langage. GPT, Claude, Mistral ou Gemini sont des LLM.
Protocole ouvert (créé par Anthropic) qui permet de connecter une IA à des outils et sources de données externes de façon standardisée : bases de données, API, fichiers, services.
Un modèle capable de traiter plusieurs types de contenus : texte, images, audio, vidéo — en entrée, en sortie, ou les deux.
Un modèle « open weights » publie ses poids (téléchargeables, exécutables chez soi), comme Llama ou Mistral. Vraiment open source impliquerait aussi données et code d'entraînement — c'est rare.
L'instruction qu'on donne à une IA. La qualité du prompt détermine en grande partie la qualité de la réponse — d'où le « prompt engineering », l'art de bien formuler ses demandes.
Compression d'un modèle en réduisant la précision de ses poids pour qu'il tourne sur du matériel modeste (un PC, un téléphone), au prix d'une légère perte de qualité.
Technique qui consiste à chercher des documents pertinents (dans une base interne, par exemple) et à les injecter dans le prompt pour que le modèle réponde avec des informations à jour et vérifiables.
Paramètre qui règle la créativité d'un modèle : basse (0-0.3) pour des réponses factuelles et reproductibles, haute (0.7+) pour des réponses variées et créatives.
L'unité de texte que manipule un LLM, environ 3-4 caractères en français. Les limites et les prix des API sont exprimés en tokens.