Agents IA en entreprise : ce qu’ils font vraiment

GuidePar la rédaction11 min

Un chatbot vous répond. Un agent IA agit. C’est toute la différence, et c’est aussi la source de la plupart des malentendus de 2026. On vous vend des « agents » partout ; dans les faits, Gartner estime que sur des milliers de fournisseurs, à peine 130 proposent une vraie technologie agentique. Le reste relève du rebranding.

Un agent IA est un système logiciel qui poursuit un objectif de façon autonome : il raisonne, planifie une suite d’étapes, utilise des outils (CRM, e-mail, base de données) et exécute des actions, sans qu’on lui dicte chaque mouvement. Là où un chatbot produit du texte, un agent accomplit une tâche : il traite un remboursement, qualifie un prospect, classe une facture. Ce guide trace précisément ce qu’il fait dans une TPE/PME, ce qu’il coûte, et où sont ses limites réelles, chiffres à l’appui.

À jour : juin 2026.

Agents IA en entreprise, état des lieux 2025 :

62 % des organisations expérimentent au moins des agents IA / 23 % seulement à l’échelle

40 % des applications d’entreprise intégreront un agent IA dédié d’ici 2026 (contre moins de 5 % en 2025)

15 % des décisions quotidiennes de travail seront prises de façon autonome par l’IA d’ici 2028 (contre 0 % en 2024)

Plus de 40 % des projets d’IA agentique abandonnés d’ici fin 2027 (prévision)

Sources : McKinsey, State of AI 2025 (nov. 2025) ; Gartner (août 2025) ; Gartner (juin 2025)

Agent IA, chatbot, IA générative : quelle différence ?

La confusion vient du vocabulaire. Trois objets coexistent en 2026, et on les range tous sous l’étiquette « IA ». Les distinguer, c’est éviter d’acheter un chatbot au prix d’un agent. IBM résume bien la frontière : l’IA générative produit du contenu, l’IA agentique accomplit des tâches.

Critère	Chatbot	Agent IA	IA agentique (multi-agents)
Fonctionnement	Question → réponse scriptée	Objectif → plan en plusieurs étapes	Orchestre plusieurs agents et outils
Initiative	Réactif, attend qu’on lui parle	Vous fixez le but, il agit pour l’atteindre	Proactif, décide seul de l’enchaînement
Accès aux outils	Non	Oui (CRM, e-mail, API, bases)	Oui, plus des sous-agents
Mémoire	Limitée à la session	Raisonnement et mémoire de tâche	Mémoire sur l’ensemble du process
Résultat	De l’information	Une action accomplie	Un process traversant plusieurs systèmes

Concrètement : un chatbot répond « votre commande arrive demain ». Un agent, lui, accède au transporteur, constate le retard, déclenche le remboursement partiel et envoie le mail de confirmation. Le premier informe. Le second exécute. Cette autonomie repose sur trois briques techniques : la planification (l’agent décompose l’objectif en sous-tâches), le tool use (il appelle des outils externes via des API) et une boucle décision-action où le modèle dirige lui-même son enchaînement.

À retenir : si l’outil ne fait que répondre, c’est un chatbot, même si on l’appelle « agent ». La question à poser à un fournisseur : « qu’est-ce que votre agent fait dans mes outils, sans que j’intervienne ? » S’il n’a pas de réponse précise, c’est de l’« agent washing ».

Ce que les agents IA font vraiment dans une TPE/PME

Du concept, passons aux tâches. Cinq usages arrivent à maturité pour une petite structure en 2026. Pour chacun, voici ce que l’agent exécute réellement et le gain ou la limite observés. J’ai écarté les promesses non vérifiables : chaque ligne s’appuie sur un cas documenté ou sur une capacité établie.

Cas d’usage	Ce que fait l’agent	Gain / limite
Support client niveau 1	Lit la demande, interroge la base de connaissances et le CRM, résout ou escalade	Jusqu’à 87 % de self-service mesuré (cas Synthesia) ; déraille sur les cas complexes
Qualification de leads	Trie les formulaires entrants, enrichit la fiche, route vers le bon commercial	Libère du temps commercial ; chiffres fournisseurs à prendre avec prudence
Relances et recouvrement	Priorise les impayés, rédige et envoie les relances, suit les promesses de paiement	DSO réduit de 28 % et 1 000 h/an économisées (cas Ferrero) ; supervision requise
Traitement de documents	Extrait montants, dates, références d’une facture ou d’un contrat, les classe	95 à 99 % de précision sur documents complexes (contre ~80 % pour l’OCR seul)
Veille	Surveille des sources, résume, alerte sur un seuil	Gain de temps réel ; risque d’hallucination sur la synthèse, à vérifier

Ce tableau sert de base à une décision honnête. Les deux lignes les plus solides sont le traitement de documents et le recouvrement, parce que ce sont des tâches cadrées, à fort volume, avec un résultat vérifiable. La veille et la qualification de leads restent prometteuses, mais moins documentées par des cas chiffrés sérieux : méfiez-vous des « +70 % de conversion » sans étude derrière. Sur ce volet commercial, nous détaillons le workflow réel dans notre guide pour trouver des clients avec l’IA.

Cas Ferrero (recouvrement) : HighRadius, étude de cas Ferrero (28 % de DSO en moins, plus de 1 000 heures économisées par an).

Le support client : le cas Klarna, succès et rétropédalage

C’est le cas le plus cité au monde, et il faut le raconter en entier, pas seulement la partie flatteuse. En février 2024, Klarna annonce que son assistant IA, développé avec OpenAI, gère les deux tiers de ses conversations de service client dès le premier mois.

Klarna, assistant IA support, premier mois (2024) :

2,3 millions de conversations traitées / soit les deux tiers du total

700 agents temps plein / équivalent du travail abattu

2 minutes pour résoudre une demande / contre 11 minutes auparavant

25 % de baisse / des demandes répétées

40 millions de dollars / d’amélioration du profit estimée sur 2024

Sources : Klarna, communiqué officiel (27 février 2024) ; sur le retour partiel à l’humain : Bloomberg (8 mai 2025)

Voilà pour la vitrine. Reste le revers, que beaucoup d’articles oublient. En mai 2025, Klarna fait machine arrière et recommence à recruter des humains pour son support. Son PDG, Sebastian Siemiatkowski, reconnaît auprès de Bloomberg que la priorité au coût a produit une qualité « moindre », et qu’il juge désormais essentiel de garantir au client qu’un humain sera toujours disponible s’il le souhaite. Le bon enseignement n’est donc pas « l’agent remplace le support », mais « l’agent absorbe le volume répétitif, l’humain reprend la valeur ». Cette nuance sépare un projet qui tient d’un projet qui finit dans les 40 % abandonnés.

Pour une TPE, le cas plus représentatif est celui de Synthesia : via l’agent de support Fin (Intercom), l’entreprise a résolu plus de 6 000 conversations et économisé plus de 1 300 heures en six mois, avec un taux de self-service jusqu’à 87 %. Un ordre de grandeur atteignable, sans cape de super-héros.

Source : Intercom, étude de cas Synthesia

Le traitement de documents : le gain le plus tangible

Si vous deviez n’automatiser qu’une chose, ce serait celle-ci. Un agent de traitement documentaire lit une facture ou un contrat, en extrait les champs utiles (montant, TVA, échéance, parties) et les pousse dans votre comptabilité ou votre CRM. La précision atteint 95 à 99 % sur des documents complexes, là où l’OCR classique plafonne autour de 80 %. C’est exactement le type de chantier qui rejoint la gestion de la comptabilité assistée par l’IA : la corvée de saisie disparaît, l’humain valide.

Comment un agent IA s’intègre concrètement

Un agent ne sert à rien isolé. Sa valeur vient de sa connexion à vos outils. En 2026, l’intégration passe par trois voies, de la plus simple à la plus technique.

Les plateformes no-code. Vous assemblez l’agent par glisser-déposer (n8n, Make, Microsoft Copilot Studio). Idéal pour démarrer sans développeur. C’est la voie d’entrée des TPE/PME, et nous détaillons la marche à suivre dans notre guide pour créer son propre agent IA.
Les connecteurs préconstruits. Des catalogues d’intégrations prêtes à l’emploi relient l’agent à votre CRM, votre messagerie, votre agenda en quelques clics.
Le MCP (Model Context Protocol). Standard ouvert introduit par Anthropic fin 2024, adopté ensuite par OpenAI et Microsoft. Il joue le rôle de « prise universelle » entre un agent et vos systèmes : un agent peut lire votre CRM, votre agenda et vos e-mails pour produire un briefing en quelques secondes.

Plateformes no-code d’agents IA, tarifs juin 2026 :

n8n : à partir de 24 € / mois (offre Starter, 2 500 exécutions) ; version auto-hébergée gratuite

Make : à partir de 9 $ / mois ; offre gratuite à 1 000 crédits

Microsoft Copilot Studio : pack à 200 $ / mois (25 000 crédits) ou paiement à l’usage

Coût API au token (modèle haut de gamme) : ~0,015 à 0,12 $ par conversation de support

Sources : n8n, Make, Microsoft Copilot Studio (juin 2026)

Un point que les éditeurs n’affichent pas en gras : la facturation à l’usage est une bonne nouvelle pour démarrer, et un piège à l’échelle. Tant que le volume est faible, vous payez quelques dizaines d’euros. Mais un agent qui boucle, qui interroge le modèle trop souvent ou traite des milliers d’interactions peut faire grimper la note bien au-delà du prévu. Surveillez la consommation dès le premier mois, pas au premier relevé surprise.

Les limites et les risques que personne n’assume

C’est la section que les démos commerciales sautent. Un agent IA n’est pas fiable « par défaut », et plus la tâche compte d’étapes, plus le risque grimpe. Trois limites méritent d’être posées avant tout projet.

La fiabilité réelle : bien plus basse qu’annoncé

Les benchmarks indépendants 2025 sont sévères, et c’est sain de les connaître. Quand on confie à des agents des tâches de bureau réalistes, ils échouent la majorité du temps. Sur des tâches CRM en plusieurs étapes, le taux de réussite chute à un tiers environ.

Taux de réussite des agents IA, benchmarks 2025 :

24 à 30 % de tâches menées à terme / simulation d’entreprise (Carnegie Mellon, TheAgentCompany)

environ 70 % d’échec / sur des tâches de bureau standard, même pour les meilleurs modèles

58 % de réussite / sur tâche CRM en une seule étape (Salesforce, CRMArena-Pro)

35 % de réussite / sur la même tâche en plusieurs étapes

Sources : Carnegie Mellon University (juin 2025) ; The Register / Salesforce AI Research (juin 2025)

Pourquoi cet écart entre la démo et le réel ? L’erreur en cascade. Un agent enchaîne des étapes, et chaque étape peut rater. Faites le calcul : même avec une fiabilité de 99 % par étape, une tâche de 100 étapes ne réussit que dans 37 % des cas (0,99 puissance 100). Plus la chaîne est longue, plus le résultat final est fragile. C’est mathématique, pas pessimiste. La leçon pratique : cadrez les agents sur des tâches courtes et bien délimitées, et gardez l’humain en validation sur les chaînes longues.

La sécurité et les données : un risque concret, pas théorique

Un agent qui lit vos e-mails et accède à vos systèmes ouvre une surface d’attaque nouvelle. La principale menace porte un nom : l’injection de prompt. L’OWASP la classe risque numéro un des applications LLM en 2025 (référence LLM01:2025). Le principe : un attaquant cache des instructions dans un e-mail, un document ou une page web ; l’agent les lit et les exécute comme s’il s’agissait d’un ordre légitime.

Ce n’est pas un scénario de laboratoire. En 2025, la faille EchoLeak (CVE-2025-32711), identifiée par Aim Labs et corrigée par Microsoft, a visé Microsoft 365 Copilot : un simple e-mail piégé pouvait déclencher l’exfiltration de données internes, sans le moindre clic de la victime. C’est le premier cas connu d’injection de prompt aboutissant à une exfiltration réelle dans un produit en production. Côté conformité, la CNIL a publié en juillet 2025 ses recommandations sur l’application du RGPD aux systèmes d’IA, où elle pointe notamment les risques liés aux données personnelles, dont la régurgitation par les modèles génératifs. Conséquence pratique : un agent ne doit jamais avoir plus de droits que strictement nécessaire, et toute action sensible (paiement, envoi externe, suppression) doit passer par une validation.

Sources : OWASP Top 10 for LLM Applications, LLM01:2025 ; NVD, CVE-2025-32711 (EchoLeak) ; CNIL, recommandations IA et RGPD (juillet 2025)

Attention : avant de brancher un agent sur vos outils, posez-vous une question simple : « si cet agent était piraté, à quoi aurait-il accès ? » La réponse définit ses permissions. Le principe du moindre privilège n’est pas une option, c’est la base.

La supervision : « human-on-the-loop », pas pilote automatique

C’est la raison de fond derrière la prévision de Gartner : plus de 40 % des projets d’IA agentique seront abandonnés d’ici fin 2027, à cause de coûts qui dérapent, d’une valeur métier floue et de contrôles de risque insuffisants. La cause n’est pas la technologie, c’est l’illusion de l’autonomie totale.

Le bon modèle n’est pas « je lance l’agent et j’oublie ». C’est l’humain qui supervise : l’agent traite le volume, signale les cas douteux, et une personne valide les décisions qui engagent. On parle de passage du human-in-the-loop (l’humain dans chaque étape) au human-on-the-loop (l’humain qui surveille et reprend la main au besoin). Sur les tâches à enjeu, supprimer totalement la supervision, c’est préparer l’abandon du projet. Vu de près, les déploiements qui tiennent sont presque toujours ceux où l’agent a un périmètre étroit et une supervision claire.

Par où commencer, sans se brûler

Inutile de viser l’agent qui gère toute l’entreprise. Les projets qui réussissent commencent petit, sur une tâche mesurable. L’ordre que je recommande tient en cinq étapes.

Choisissez une tâche unique, répétitive et vérifiable. Le traitement de factures ou les relances d’impayés sont d’excellents premiers chantiers : volume élevé, résultat contrôlable, faible risque.
Démarrez sur une plateforme no-code. n8n, Make ou Copilot Studio permettent de prototyper en quelques heures, sans développeur. Comptez 9 à 50 € par mois pour tester. Si vous débutez tout juste avec l’IA, commencez plus simplement encore, avec nos premiers pas pour utiliser l’IA dans une TPE sans être technique.
Gardez l’humain en validation les premières semaines. Laissez l’agent proposer, vous validez. Vous mesurez son taux d’erreur réel avant de lui lâcher la bride.
Surveillez les coûts dès le premier mois. Posez un plafond de consommation. Un agent mal cadré coûte vite plus cher que le temps qu’il fait gagner.
Élargissez seulement si le ROI est mesuré. Un cas qui marche en justifie un deuxième. Pas l’inverse.

Cette logique d’automatisation des process, brique par brique, c’est exactement ce qu’notre agence met en place : identifier la tâche à fort volume, connecter les bons outils, cadrer l’agent et la supervision, et mesurer le gain avant d’étendre. L’objectif n’est jamais « remplacer une équipe » mais libérer du temps sur ce qui n’a aucune valeur ajoutée.

FAQ

Quelle est la différence entre un agent IA et un chatbot ?
Un chatbot répond à des questions ; un agent IA accomplit des tâches. L’agent raisonne, planifie plusieurs étapes, accède à vos outils (CRM, e-mail, comptabilité) et exécute des actions de façon autonome. Le chatbot informe, l’agent agit. C’est la frontière à vérifier avant tout achat.

Les agents IA sont-ils fiables en entreprise ?
Pas par défaut. Les benchmarks 2025 montrent que les meilleurs agents ne réussissent que 24 à 35 % des tâches multi-étapes réalistes. Plus une tâche compte d’étapes, plus le risque d’erreur en cascade grimpe. Ils sont fiables sur des tâches courtes, cadrées et supervisées, pas en pilote automatique.

Combien coûte un agent IA pour une TPE ?
Pour démarrer sur une plateforme no-code, comptez 9 à 50 € par mois (Make, n8n). Microsoft Copilot Studio démarre à 200 $/mois. À l’usage, une conversation de support coûte quelques centimes en API. Attention à la dérive des coûts si le volume explose : posez un plafond dès le départ.

Quels cas d’usage sont les plus matures pour une PME ?
Le traitement de documents (95 à 99 % de précision), le support client niveau 1 (jusqu’à 87 % de self-service) et les relances d’impayés (DSO réduit de 28 % sur des cas documentés). Ce sont des tâches à fort volume, cadrées et au résultat vérifiable, donc les plus sûres pour commencer.

Un agent IA présente-t-il des risques de sécurité ?
Oui. L’injection de prompt est classée risque numéro un des applications IA par l’OWASP : un e-mail ou un document piégé peut détourner l’agent. La faille EchoLeak a visé Microsoft 365 Copilot en 2025. Limitez les droits de l’agent au strict nécessaire et validez toute action sensible.

Pourquoi tant de projets d’agents IA échouent-ils ?
Gartner prévoit l’abandon de plus de 40 % des projets d’ici fin 2027, à cause de coûts qui dérapent, d’une valeur métier mal définie et d’une supervision insuffisante. La cause n’est pas la technologie mais l’illusion de l’autonomie totale. Les projets qui tiennent ont un périmètre étroit et un humain qui supervise.

Sources : McKinsey, « The State of AI in 2025 » (novembre 2025) ; Gartner, prévisions IA agentique (25 juin et 26 août 2025) ; Klarna, communiqué officiel sur l’assistant IA (27 février 2024) et Bloomberg sur le retour partiel à l’humain (mai 2025) ; Intercom, étude de cas Synthesia ; HighRadius, étude de cas Ferrero ; Carnegie Mellon University, benchmark TheAgentCompany (juin 2025) ; Salesforce AI Research, CRMArena-Pro via The Register (juin 2025) ; OWASP Top 10 for LLM Applications (LLM01:2025, injection de prompt) ; faille EchoLeak CVE-2025-32711 sur Microsoft 365 Copilot (2025) ; CNIL, recommandations IA et RGPD (juillet 2025) ; IBM, AWS, Google Cloud et Anthropic pour les définitions de référence ; tarifs n8n, Make et Microsoft Copilot Studio (juin 2026). Données à jour au 24 juin 2026.

Sources

Vous êtes une entreprise ?

Ordiama, c'est aussi une agence IA à Strasbourg : on crée votre site, on vous rend visible dans l'IA et on automatise vos tâches.

Découvrir l'agence →