Glossaire IA

Les termes essentiels, expliqués simplement.

Agent (IA)

Un système où le modèle ne se contente pas de répondre : il enchaîne des actions (chercher sur le web, exécuter du code, appeler des outils) en autonomie pour accomplir un objectif.

AGI (Artificial General Intelligence)

Intelligence artificielle générale : une IA hypothétique aussi compétente qu'un humain sur l'ensemble des tâches cognitives. Objet de débats intenses sur sa faisabilité et son horizon.

Benchmark

Test standardisé pour comparer les modèles entre eux (MMLU, HumanEval, etc.). Utile mais imparfait : les modèles peuvent être sur-optimisés pour les benchmarks.

Embedding

Représentation d'un texte sous forme de vecteur de nombres qui capture son sens. Deux textes proches sémantiquement ont des embeddings proches — c'est la base de la recherche sémantique et du RAG.

Fenêtre de contexte

La quantité maximale de texte (en tokens) qu'un modèle peut prendre en compte d'un coup : la conversation, les documents fournis, les instructions. Au-delà, il « oublie ».

Fine-tuning

Ré-entraîner un modèle existant sur des données spécifiques pour le spécialiser dans une tâche ou un domaine, plutôt que de repartir de zéro.

GPU

Processeur graphique, devenu le matériel clé de l'IA : l'entraînement et l'inférence des grands modèles tournent massivement sur GPU (Nvidia en tête), d'où les enjeux géopolitiques autour des puces.

Hallucination

Quand un modèle invente une information fausse avec assurance : un chiffre, une source, un fait. C'est le principal risque pratique des LLM — toujours vérifier les faits critiques.

Inférence

La phase où le modèle est utilisé pour générer des réponses (par opposition à l'entraînement). Le coût d'inférence est ce qu'on paie quand on appelle une API d'IA.

LLM (Large Language Model)

Grand modèle de langage : une IA entraînée sur d'énormes volumes de texte pour comprendre et générer du langage. GPT, Claude, Mistral ou Gemini sont des LLM.

MCP (Model Context Protocol)

Protocole ouvert (créé par Anthropic) qui permet de connecter une IA à des outils et sources de données externes de façon standardisée : bases de données, API, fichiers, services.

Multimodal

Un modèle capable de traiter plusieurs types de contenus : texte, images, audio, vidéo — en entrée, en sortie, ou les deux.

Open weights / open source

Un modèle « open weights » publie ses poids (téléchargeables, exécutables chez soi), comme Llama ou Mistral. Vraiment open source impliquerait aussi données et code d'entraînement — c'est rare.

Prompt

L'instruction qu'on donne à une IA. La qualité du prompt détermine en grande partie la qualité de la réponse — d'où le « prompt engineering », l'art de bien formuler ses demandes.

Quantization

Compression d'un modèle en réduisant la précision de ses poids pour qu'il tourne sur du matériel modeste (un PC, un téléphone), au prix d'une légère perte de qualité.

RAG (Retrieval-Augmented Generation)

Technique qui consiste à chercher des documents pertinents (dans une base interne, par exemple) et à les injecter dans le prompt pour que le modèle réponde avec des informations à jour et vérifiables.

Température

Paramètre qui règle la créativité d'un modèle : basse (0-0.3) pour des réponses factuelles et reproductibles, haute (0.7+) pour des réponses variées et créatives.

Token

L'unité de texte que manipule un LLM, environ 3-4 caractères en français. Les limites et les prix des API sont exprimés en tokens.