Google DeepMind alerte sur les risques des interactions massives entre agents IA autonomes

Google DeepMind finance des recherches sur les risques liés à l’interaction massive entre agents IA autonomes, un scénario où des millions d’entités pourraient évoluer sans supervision humaine. Selon Rohin Shah, directeur de la recherche sur la sécurité et l’alignement de l’AGI au sein de l’entreprise, l’arrivée sur le marché grand public d’agents capables d’exécuter des tâches de manière indépendante et de recevoir des instructions d’autres agents soulève des questions majeures. Ces interactions pourraient générer des comportements imprévisibles ou malveillants, difficiles à contrôler une fois le processus enclenché.

L’initiative s’inscrit dans une démarche proactive pour anticiper les défis posés par l’autonomie croissante des systèmes d’IA. DeepMind met en garde contre les risques systémiques, où des boucles de rétroaction entre agents pourraient amplifier des dynamiques indésirables, comme des stratégies de contournement des garde-fous ou des coalitions d’agents aux objectifs divergents. Les travaux financés visent à identifier des mécanismes de régulation ou de limitation des interactions, avant que de telles situations ne deviennent incontrôlables.

Google DeepMind alerte sur les risques des interactions massives entre agents IA autonomes

Articles liés

Les modèles d'IA dangereux pourraient devenir la norme, selon des experts

OpenAI lance une simulation pour anticiper les comportements de ses modèles avant déploiement