- 01Un agent = un LLM dans une boucle observer → décider → agir, jusqu'à résolution.
- 02Trois piliers : un jeu d'outils, une mémoire de travail, et une condition d'arrêt.
- 03Sans garde-fous (limite d'itérations, budget, validation), un agent part en vrille.
Un agent IA n'est pas un modèle plus intelligent : c'est un LLM placé dans une boucle, équipé d'outils et d'une mémoire, qui itère jusqu'à atteindre un objectif. Ce tuto décrit l'architecture concrète d'un agent et, surtout, les garde-fous sans lesquels il devient incontrôlable.
La boucle agentique
Au cœur de tout agent, le même cycle se répète :
objectif
└─> [LLM décide] ──> appelle un outil ──> observe le résultat
^ │
└──────────────────────────────────────────┘
jusqu'à : objectif atteint
- On donne un objectif à l'agent.
- Le LLM décide de la prochaine action (appeler un outil, ou conclure).
- Le système exécute l'outil et renvoie le résultat (l'observation).
- Le LLM intègre cette observation et recommence — jusqu'à juger la tâche finie.
C'est le function calling (vu en intermédiaire) mis en boucle.
Les trois piliers
1. Les outils. Ce que l'agent peut faire : chercher sur le web, lire un fichier, requêter une base, appeler une API. La qualité d'un agent dépend directement de la qualité et de la clarté de ses outils.
2. La mémoire de travail. L'historique des actions et observations, réinjecté à chaque tour pour que l'agent sache où il en est. Attention : cet historique gonfle vite et coûte des tokens — d'où la nécessité de le résumer ou de l'élaguer.
3. La condition d'arrêt. Comment l'agent sait qu'il a terminé. Sans elle, il boucle indéfiniment.
Les garde-fous, partie non négociable
Un agent laissé libre peut boucler à l'infini, brûler votre budget ou enchaîner des actions destructrices. Posez systématiquement :
- Une limite d'itérations (ex. 10 tours max), pour éviter les boucles infinies.
- Un budget de tokens/coût par exécution, avec arrêt si dépassé.
- Une validation humaine sur les actions sensibles ou irréversibles.
- Un périmètre d'outils restreint : ne donnez accès qu'au strict nécessaire.
- Un journal de chaque décision, pour pouvoir auditer après coup.
Le piège du « plus d'outils = mieux »
Donner 30 outils à un agent dégrade ses performances : il se perd dans le choix. Mieux vaut 5 outils bien décrits que 30 vagues. Si le périmètre est large, envisagez plutôt de spécialiser plusieurs agents (sujet du tuto multi-agents) que de surcharger un seul.
Concevoir la boucle, pas seulement le prompt
L'erreur classique est de tout miser sur un prompt parfait. Un bon agent se joue surtout dans l'ingénierie de la boucle : comment vous gérez la mémoire, comment vous formatez les observations, quand vous coupez. Le prompt compte, mais l'architecture autour compte davantage.
À retenir
Un agent, c'est un LLM dans une boucle observer → décider → agir, porté par trois piliers : des outils, une mémoire de travail, une condition d'arrêt. Les garde-fous (limite d'itérations, budget, validation humaine, périmètre restreint) ne sont pas optionnels — ce sont eux qui séparent un agent utile d'un agent qui part en vrille. Et soignez la boucle autant que le prompt.
Articles liés
Architecturer un système multi-agents : orchestrateur et sous-agents
Quand un seul agent ne suffit plus, on répartit le travail. Patterns d'orchestration, communication entre agents et pièges à éviter.
Le function calling : laisser une IA déclencher des actions
Comment une IA passe de « parler » à « agir » : interroger une base, envoyer un mail, appeler une API. Le mécanisme du function calling.
Sécuriser une application LLM : prompt injection et fuites de données
Les apps IA ouvrent une surface d'attaque nouvelle. Prompt injection, exfiltration de données, outils détournés : les risques et les parades.