Sécurité de l'IA.
Injection de prompt, rayon d'action des agents, journaux d'audit et modélisation des menaces — une sécurité de niveau praticien pour des systèmes qui décident à l'exécution de ce qu'ils font.
L'injection de prompt n'est pas une classe de bug, c'est une frontière de confiance
Arrête de corriger les jailbreaks un par un. Trace correctement la frontière et la plupart cessent d'avoir de l'importance.
Le prompt est le nouveau périmètre
Vingt ans de pensée pare-feu nous ont appris à tracer un cercle autour des choses auxquelles nous faisons confiance. Les LLM ont avalé le cercle. Ce qui le remplace n'est pas une autre boîte — c'est une discipline.
Le rayon d'explosion d'un agent doté d'un outil de trop
Chaque outil que vous accordez à un agent est une capacité dont hérite un attaquant. Une méthode pour mesurer les dégâts avant qu'ils n'arrivent.
Un petit rituel pour lire les threat models des autres
Cinq questions que je pose avant même d'ouvrir un schéma. La plupart des documents échouent à la question deux.
Ton pipeline RAG est un adjoint confus
Un article de 1988 en dit plus sur les agents modernes à génération augmentée par la récupération que la plupart de ceux de 2024.
Le journal d'audit est la fonctionnalité de sécurité IA la plus sous-estimée
Si vous ne pouvez pas rejouer ce que votre agent a fait, vous n'avez pas un produit — vous avez un pari.
Le moindre privilège pour les modèles de langage
Le principe a quarante ans. L'appliquer à un LLM avec accès aux outils, c'est là que ça devient intéressant.
Votre system prompt n'est pas un contrôle de sécurité
« Ne révèle pas le system prompt » est une requête polie, pas une frontière. À quoi ressemble un vrai contrôle.
Modéliser les menaces d'une fonctionnalité LLM en un après-midi
Un rituel léger : flux de données, frontières de confiance, et les cinq questions qui font remonter les vrais risques rapidement.
L'injection de prompt indirecte et les documents que tu n'as pas écrits
Les instructions dangereuses ne viennent pas de ton utilisateur. Elles viennent de la page web que ton agent vient de lire.
Le « confused deputy » s'attaque à votre pipeline RAG
Un problème de 1988, habillé à la mode 2026. Pourquoi la récupération combinée aux outils est une machine à confondre les privilèges.
Logger assez pour survivre à un incident
Quand l'agent fait quelque chose de coûteux, tu dois rejouer exactement ce qu'il a vu. La plupart des équipes ne le peuvent pas.
À quoi ressemble vraiment le red teaming d'un LLM
Moins de Hollywood, plus de tableur. Un processus reproductible pour trouver les défaillances avant vos utilisateurs.
La gestion des sorties, c'est là où le XSS revient
La sortie du modèle est une entrée non fiable pour le système suivant. Traite-la comme une entrée utilisateur, ou hérite d'une décennie de bugs web.
Secrets, outils, et l'agent qui a lu votre fichier env
Donnez un accès shell à un agent et vos secrets ne sont plus qu'à un prompt astucieux. Des schémas de confinement qui tiennent.
Sandboxer les appels d'outils sans tuer le produit
Une isolation trop stricte ne livre rien ; trop lâche, elle livre des incidents. Trouver la juste ligne.
Pourquoi les allow-lists battent les prompts de garde-fou
On ne prompte pas son chemin jusqu'à une frontière de sécurité. Énumérez ce qui est autorisé et refusez le reste.
Exfiltration de données via un assistant serviable
L'assistant n'a pas divulgué les données par malveillance. Il était simplement serviable envers la mauvaise personne.