ulrich.dev

Sécurité de l'IA.

Injection de prompt, rayon d'action des agents, journaux d'audit et modélisation des menaces — une sécurité de niveau praticien pour des systèmes qui décident à l'exécution de ce qu'ils font.

Tous les articles →

Sécurité de l'IA · 22 mai 2026 · 3 min de lecture

L'injection de prompt n'est pas une classe de bug, c'est une frontière de confiance

Arrête de corriger les jailbreaks un par un. Trace correctement la frontière et la plupart cessent d'avoir de l'importance.

Sécurité de l'IA · 21 mai 2026 · 14 min de lecture

Le prompt est le nouveau périmètre

Vingt ans de pensée pare-feu nous ont appris à tracer un cercle autour des choses auxquelles nous faisons confiance. Les LLM ont avalé le cercle. Ce qui le remplace n'est pas une autre boîte — c'est une discipline.

Sécurité de l'IA · 1 mai 2026 · 3 min de lecture

Le rayon d'explosion d'un agent doté d'un outil de trop

Chaque outil que vous accordez à un agent est une capacité dont hérite un attaquant. Une méthode pour mesurer les dégâts avant qu'ils n'arrivent.

Sécurité de l'IA · 29 avr. 2026 · 4 min de lecture

Un petit rituel pour lire les threat models des autres

Cinq questions que je pose avant même d'ouvrir un schéma. La plupart des documents échouent à la question deux.

Sécurité de l'IA · 22 avr. 2026 · 13 min de lecture

Ton pipeline RAG est un adjoint confus

Un article de 1988 en dit plus sur les agents modernes à génération augmentée par la récupération que la plupart de ceux de 2024.

Sécurité de l'IA · 15 avr. 2026 · 7 min de lecture

Le journal d'audit est la fonctionnalité de sécurité IA la plus sous-estimée

Si vous ne pouvez pas rejouer ce que votre agent a fait, vous n'avez pas un produit — vous avez un pari.

Sécurité de l'IA · 10 avr. 2026 · 3 min de lecture

Le moindre privilège pour les modèles de langage

Le principe a quarante ans. L'appliquer à un LLM avec accès aux outils, c'est là que ça devient intéressant.

Sécurité de l'IA · 20 mars 2026 · 3 min de lecture

Votre system prompt n'est pas un contrôle de sécurité

« Ne révèle pas le system prompt » est une requête polie, pas une frontière. À quoi ressemble un vrai contrôle.

Sécurité de l'IA · 27 févr. 2026 · 3 min de lecture

Modéliser les menaces d'une fonctionnalité LLM en un après-midi

Un rituel léger : flux de données, frontières de confiance, et les cinq questions qui font remonter les vrais risques rapidement.

Sécurité de l'IA · 6 févr. 2026 · 3 min de lecture

L'injection de prompt indirecte et les documents que tu n'as pas écrits

Les instructions dangereuses ne viennent pas de ton utilisateur. Elles viennent de la page web que ton agent vient de lire.

Sécurité de l'IA · 16 janv. 2026 · 3 min de lecture

Le « confused deputy » s'attaque à votre pipeline RAG

Un problème de 1988, habillé à la mode 2026. Pourquoi la récupération combinée aux outils est une machine à confondre les privilèges.

Sécurité de l'IA · 26 déc. 2025 · 3 min de lecture

Logger assez pour survivre à un incident

Quand l'agent fait quelque chose de coûteux, tu dois rejouer exactement ce qu'il a vu. La plupart des équipes ne le peuvent pas.

Sécurité de l'IA · 5 déc. 2025 · 3 min de lecture

À quoi ressemble vraiment le red teaming d'un LLM

Moins de Hollywood, plus de tableur. Un processus reproductible pour trouver les défaillances avant vos utilisateurs.

Sécurité de l'IA · 14 nov. 2025 · 3 min de lecture

La gestion des sorties, c'est là où le XSS revient

La sortie du modèle est une entrée non fiable pour le système suivant. Traite-la comme une entrée utilisateur, ou hérite d'une décennie de bugs web.

Sécurité de l'IA · 24 oct. 2025 · 3 min de lecture

Secrets, outils, et l'agent qui a lu votre fichier env

Donnez un accès shell à un agent et vos secrets ne sont plus qu'à un prompt astucieux. Des schémas de confinement qui tiennent.

Sécurité de l'IA · 3 oct. 2025 · 3 min de lecture

Sandboxer les appels d'outils sans tuer le produit

Une isolation trop stricte ne livre rien ; trop lâche, elle livre des incidents. Trouver la juste ligne.

Sécurité de l'IA · 12 sept. 2025 · 3 min de lecture

Pourquoi les allow-lists battent les prompts de garde-fou

On ne prompte pas son chemin jusqu'à une frontière de sécurité. Énumérez ce qui est autorisé et refusez le reste.

Sécurité de l'IA · 22 août 2025 · 3 min de lecture

Exfiltration de données via un assistant serviable

L'assistant n'a pas divulgué les données par malveillance. Il était simplement serviable envers la mauvaise personne.