ulrich.dev

Essais sur l'injection de prompt

L'injection de prompt est la première entrée du Top 10 OWASP pour les applications LLM (LLM01) — et la plus persistante, parce qu'elle n'est pas un bug à corriger mais une conséquence de la façon dont les modèles traitent le texte. Quand l'instruction et la donnée empruntent le même canal, tout contenu que le modèle lit peut tenter de devenir une instruction : un message utilisateur, un document récupéré, une page web. Ces essais traitent l'injection comme une question de frontière de confiance plutôt que de formulation : pourquoi un prompt système ne tient pas lieu de contrôle, comment l'injection indirecte arrive par des documents que vous n'avez pas écrits, et quels contrôles — allow-lists, séparation des privilèges, validation hors du modèle — déplacent réellement le risque. À lire en regard de MITRE ATLAS pour les tactiques adverses correspondantes.

Tous les articles → Outil lié : Testeur d'injection de prompt →