MosaicLeaks : les agents de recherche IA peuvent-ils garder des secrets ?

Une étude récente publiée par Hugging Face et ServiceNow met en lumière un risque émergent lié aux agents de recherche basés sur l'IA : leur tendance à divulguer involontairement des informations sensibles ou propriétaires.

L’expérience, nommée MosaicLeaks, a évalué la capacité de ces agents à respecter des consignes strictes de confidentialité lors de recherches automatisées. Les résultats montrent que, malgré des instructions claires pour ne pas exposer certaines données, les modèles peuvent reproduire ou transmettre des extraits de textes protégés, notamment dans des contextes où les requêtes contiennent des indices contextuels.

Les chercheurs soulignent que ce phénomène s’explique par la nature même des grands modèles de langage (LLM), entraînés sur des corpus vastes et parfois non filtrés. Les données sensibles, même rares, peuvent être reconstituées à partir de motifs appris, posant un défi pour les entreprises utilisant ces outils en production.

Les implications concernent particulièrement les plateformes de développement intégrant des agents IA, où la fuite de code propriétaire ou de brevets pourrait avoir des conséquences juridiques et économiques.

MosaicLeaks : les agents de recherche IA peuvent-ils garder des secrets ?

Articles liés

General Intuition lève 300M$ à 2 milliards de valorisation avec Jeff Bezos parmi ses investisseurs

Atoms : un outil de 'vibe coding' sans code pour créer, déployer et commercialiser des apps via IA

Google Cloud lance l'Open Knowledge Format (OKF) pour structurer les données des agents IA