Les trois vérifications que je fais avant de faire confiance à la sortie d'un agent
Par Ulrich Dohou, AI Engineer à Paris
J’ai passé un bon moment à reconstruire mon workflow autour des agents, et la leçon n’est pas « les agents, c’est magique ». C’est que le levier n’apparaît que lorsque vous posez de vraies barrières autour de ce que l’agent est autorisé à faire.
Relire la bonne chose
Le goulot d’étranglement ne disparaît pas quand la génération devient bon marché ; il se déplace vers la revue. Les équipes qui se sentent réellement plus rapides sont celles qui ont investi pour rendre la revue rapide, pas seulement pour faire écrire davantage le modèle.
Là où le temps part vraiment
Les petites automatisations se cumulent. Un script qui fait gagner deux minutes paraît insignifiant. Vingt d’entre eux, tournant discrètement sur un trimestre, changent la texture du travail — ils relèvent le plancher, pas le plafond.
Je relis le diff, jamais le chat. La conversation peut paraître parfaite tandis que le changement réel touche discrètement trois fichiers qu’il ne devrait pas. Le diff est la vérité terrain, et le lire n’est pas négociable, aussi convaincant qu’ait été le résumé.
Ce qui se cumule
Les agents qui gagnent une place permanente dans mon workflow partagent tous un trait : un travail étroit, bien défini, avec des critères de réussite clairs. Ceux que j’ai abandonnés sont ceux à qui j’ai demandé de « simplement se débrouiller », ce qui revient à demander de tout relire.
La barrière compte plus que le modèle
Une skill ou un prompt que l’agent ne mobilise pas de façon fiable n’est que de la documentation avec des étapes en plus. Le levier est dans le déclencheur — faire du bon comportement la valeur par défaut, pour cesser de réexpliquer le même contexte à chaque session.
Le goulot d’étranglement ne disparaît pas quand la génération devient bon marché ; il se déplace vers la revue. Les équipes qui se sentent réellement plus rapides sont celles qui ont investi pour rendre la revue rapide, pas seulement pour faire écrire davantage le modèle.
Traitez vos prompts comme du code, vos agents comme des ingénieurs juniors, et votre temps de revue comme la ressource rare qu’il est. C’est l’essentiel.
Abonnez-vous pour recevoir l'article de vendredi prochain ci-dessous.
Un e-mail · le vendredi · désabonnement à tout moment