Trouver des idées d'entreprise avec un agent IA : la méthode et les corpus
Par Ulrich Dohou, Software Engineer
Le schéma se répète avec une régularité décourageante : un fondateur indie a une idée, code six mois, lance, ne vend pas, ferme. Le diagnostic à postériori est toujours le même, l’idée existait dans la tête du fondateur, pas dans le marché. La méthode qu’a posée Damir Akaza retourne le problème par l’autre bout : les idées d’entreprise n’ont pas à être inventées, elles sont déjà écrites par milliers chaque jour sur Reddit, dans les avis Google Maps, dans les commentaires sous les vidéos d’un concurrent. Un humain ne peut pas lire ce volume. Un agent IA, lui, le fait en une nuit et restitue dix opportunités classées au matin.
L’idée est élégante parce qu’elle inverse la posture. On arrête de chercher ce qu’on aurait envie de construire et on commence à chercher ce que les gens demandent déjà. Et l’architecture qu’Akaza décrit, quatre étapes, quatre prompts, est suffisamment générique pour qu’elle mérite qu’on la regarde par le bon angle : ce n’est pas une recette à appliquer, c’est un gabarit à pointer sur des corpus très différents.
La méthode en quatre étapes, comme Akaza la pose
La structure mérite d’être posée à plat avant de discuter ce qu’on peut en faire.
Collecte. L’agent aspire les contenus d’un corpus public, posts, commentaires, avis, tickets, sur une fenêtre de temps choisie. La quantité importe moins que la couche sociale : il faut une couche où les gens écrivent honnêtement, sans posture, parce qu’ils veulent vraiment quelque chose ou parce qu’ils sont vraiment frustrés.
Extraction. Chaque post passe par un modèle qui lit et structure. Pour chaque besoin trouvé : la formulation en une phrase, le type de signal (plainte, souhait, frustration, question, vide), l’intensité, qui est concerné, ce que la personne fait à la place aujourd’hui, et le moindre signal qu’elle paierait pour une solution. Le reste, les rants politiques, les frustrations sans détail actionnable, les questions auxquelles existe déjà une réponse évidente, est jeté. C’est la passe de bruit-en-signal.
Clustering. Les besoins extraits sont des centaines, exprimés dans des mots différents. La même demande revient cinquante fois sous cinquante formulations. Un modèle plus capable regroupe ces variantes en grappes, c’est l’étape où apparaissent les patterns qu’un humain lisant les posts un par un ne voit jamais.
Scoring. Les dix grappes les plus fréquentes repassent dans un modèle, cette fois en posture sceptique. La consigne explicite est : la plupart des besoins ne sont pas une opportunité, prouve-moi le contraire. Solutions existantes, raisons de leur insuffisance, taille du segment, canal d’acquisition probable des dix premiers clients, drapeaux rouges. Ça produit un classement honnête, pas un pitch.
Le livrable est un rapport. Pas un produit, pas une roadmap, un rapport priorisé avec sources cliquables vers les posts d’origine. C’est l’amont du zero to one, pas le un.
Akaza pose la méthode sur Reddit. Là où le pattern devient vraiment intéressant, c’est quand on réalise que la même boucle marche sur n’importe quel corpus de plaintes ou de souhaits écrits, et que le substrat qu’on choisit décide presque entièrement ce qu’on sortira.
Le substrat décide ce que vous trouverez
C’est la partie qui mérite d’être pensée plus que la méthode elle-même. La méthode est une boucle de quatre prompts ; le substrat est la décision stratégique.
Reddit et Hacker News sont le terrain par défaut : r/SmallBusiness, r/SaaS, r/Entrepreneur, r/freelance, ou les fils HN où les développeurs parlent de ce qu’ils détestent dans leur stack. Sortie typique : des opportunités logicielles et services pros. C’est le corpus qui ressemble le plus au consommateur d’un fondateur indie.
Google Maps reviews changent complètement la nature du signal. On y trouve : la laverie qui ferme trop tôt, le restaurant qui n’a pas de menu végan, la salle de sport sans douches propres, le coiffeur qui ne prend pas la carte. Le pointage de l’agent sur une zone géographique précise révèle des trous de service locaux, exactement le type d’opportunité qu’un SaaS national ne verra jamais. Pour qui veut monter une activité locale, c’est le meilleur substrat possible.
TripAdvisor, Booking, et les forums voyage sont la couche tourisme. “Pas de hike kid-friendly autour de Chamonix”, “aucune visite guidée de la vieille ville en allemand”, “hôtel sans wifi qui marche”, autant de niches dont la demande est documentée mais dont l’offre est absente. Une niche d’expérience locale n’a besoin que d’un opérateur bien renseigné.
Amazon reviews et App Store reviews sont les corpus de plainte produit. L’agent extrait spécifiquement “cet objet est génial mais il manque X” ou “j’utilise cette app mais quand j’essaie Y elle plante”. Sortie typique : amélioration de produits existants, ou produit complémentaire. C’est l’opposé du Maps : pas de géographie, beaucoup de volume.
GitHub issues sont la version dev. Les tickets ouverts depuis trois ans, upvotés et jamais implémentés, sont littéralement une liste écrite de produits que les développeurs voudraient acheter. Particulièrement riche pour les outils CLI, les extensions IDE, les plugins de frameworks open source.
Glassdoor et Indeed reviews sont la couche workplace. Ce que les employés détestent dans les processus internes, onboarding, gestion des notes de frais, planification, communication async. Sortie typique : SaaS B2B internes que les RH et les ops achèteraient demain.
Discord et Slack publics d’une communauté niche révèlent les besoins en temps réel d’une audience captive. Plus de friction technique pour la collecte, mais le signal est dense.
La règle est simple : chaque substrat porte une grammaire de besoin différente, et l’agent ne change pas, c’est le pointage qui change tout.
Ce que chaque étape compte vraiment
L’extraction ne cherche pas des frustrations, elle cherche des frustrations actionnables. La différence se voit dans le filtre : un “je déteste mon patron” est jeté, un “je passe trois heures par semaine à reformater des PDFs depuis le scanner” est gardé. Le critère implicite, c’est est-ce que quelqu’un paierait quelqu’un d’autre pour résoudre ça ?
Le clustering est ce qui sépare la méthode du simple scraping. Vingt personnes décrivant “je n’arrive pas à suivre mes factures de freelance” sous vingt formulations différentes ne sont pas vingt utilisateurs distincts, c’est un signal de force vingt. Sans clustering, le rapport finit avec des centaines de besoins uniques et aucune priorité réelle.
Le scoring final, en posture sceptique, est la partie qui sauve du biais d’amplification. Un agent qui dirait “voilà dix opportunités !” sans gratter pour pourquoi elles ne fonctionneraient pas est moins utile qu’un agent qui dirait “voilà dix grappes, dont deux peut-être tiennent la route, et voici pourquoi les huit autres sont des faux signaux”. La consigne sceptique fait la moitié du travail.
Les pièges de la méthode
Trois angles morts à connaître.
Le biais du corpus déclaré. Les gens qui postent sur Reddit ne sont pas les gens qui achètent. Les complainers ne sont pas les payeurs. Toute idée sortie de cette pipe doit être validée par un appel avec quelqu’un de la cible, l’agent surface, l’humain confirme.
La saturation. Quand une demande revient cinq cents fois, c’est généralement qu’elle a déjà trois concurrents. Le scoring honnête doit pénaliser les besoins trop fréquents autant que ceux trop rares. Le sweet spot est souvent une grappe de quinze à quarante occurrences, exprimée par un segment identifiable, avec une solution existante mais mal calibrée.
Le biais de fraîcheur. Pointer l’agent sur le mois en cours capte les sujets brûlants, mais les opportunités stables se voient mieux sur six mois ou un an. Une grappe qui revient à fréquence constante sur trois trimestres est plus solide qu’une grappe qui pèse cinquante posts cette semaine et disparaît la suivante.
Ce que la méthode fait bien, c’est convertir un substrat illisible en quelque chose qu’on peut décider de creuser ou d’écarter. C’est exactement la même structure que les petites boucles d’agent qui font le travail qu’on évitait, appliquée à la recherche d’idée : l’agent fait la lecture, l’humain garde le jugement. Et ce sont les petites automatisations comme celles-ci qui composent un trimestre, un rapport par semaine sur un nouveau substrat, et la liste d’opportunités s’enrichit sans effort marginal.
Si cela vous a parlé, vous aimerez La boucle d’agent qui a remplacé mon samedi et Les petites automatisations qui se cumulent sur un trimestre. Abonnez-vous ci-dessous pour recevoir le billet de vendredi prochain.
Abonnez-vous pour recevoir l'article de vendredi prochain ci-dessous.
Un e-mail · le vendredi · désabonnement à tout moment