Bonjour à tous et bienvenue dans la newsletter régulière de TechCrunch sur l’IA. Les agents arrivent, les agents IA, pour être exact. Cette semaine, Anthropic a dévoilé son dernier modèle d’IA, une version améliorée de Claude 3.5 Sonnet, qui peut interagir avec le web et les applications de bureau en cliquant et en tapant – un peu comme une personne. Ce n’est pas parfait. Mais le 3.5 Sonnet avec “Computer Use”, comme le nomme Anthropic, pourrait être une révolution en milieu de travail. C’est du moins l’argumentaire. Il reste à voir si le nouveau modèle d’Anthropic sera à la hauteur des attentes.
Cependant, son arrivée signifie les ambitions d’Anthropic sur le marché naissant des agents IA que certains analystes estiment pourrait valoir près de 50 milliards de dollars d’ici 2030. Anthropic n’est pas le seul à investir des ressources dans le développement d’agents IA qui, plus largement définis, automatisent des tâches qui devaient être effectuées manuellement. Microsoft teste des agents qui peuvent utiliser les PC Windows pour prendre des rendez-vous et plus, tandis qu’Amazon explore des agents qui peuvent effectuer des achats de façon proactive.
Les organisations sont peut-être indécises sur l’IA génératrice, mais elles sont plutôt optimistes sur les agents jusqu’à présent.
Un rapport publié ce mois-ci par MIT Technology Review Insights a révélé que 49% des dirigeants estiment que les agents et autres formes d’assistants IA avancés permettront de réaliser des gains d’efficacité ou des économies de coûts. Pour Anthropic et ses rivaux qui construisent des technologies “âgences”, c’est une très bonne nouvelle. L’IA n’est pas bon marché à construire, ni à gérer. À titre d’exemple, Anthropic est en train de lever des milliards de dollars de fonds de capital-risque, et OpenAI a récemment clôturé un tour de financement de 6,5 milliards de dollars.
Je me demande cependant si la plupart des agents actuels peuvent vraiment tenir les promesses faites. Prenons l’exemple d’Anthropic. Dans une évaluation conçue pour tester la capacité d’un agent IA à aider aux tâches de réservation de billets d’avion, le nouveau 3.5 Sonnet a réussi moins de la moitié des tâches avec succès. Dans un autre test impliquant des tâches comme l’initiation d’un retour de produit, le 3.5 Sonnet a échoué environ un tiers du temps. Encore une fois, le nouveau 3.5 Sonnet n’est pas parfait – et Anthropic le reconnaît volontiers.
Mais il est difficile d’imaginer une entreprise tolérant des taux d’échec aussi élevés pendant très longtemps. À un certain moment, il serait plus facile d’embaucher une secrétaire. Cependant, les entreprises montrent une volonté de donner une chance aux agents IA, ne serait-ce que pour rester à la hauteur des autres. Selon un sondage de l’accélérateur de start-up Forum Ventures, 48% des entreprises commencent à déployer des agents IA, tandis qu’un autre tiers “explore activement” les solutions agentiques.