Les agents IA sont supposés être la prochaine grande chose en IA, mais il n’existe pas de définition exacte de ce qu’ils sont. Jusqu’à présent, les gens ne peuvent pas s’entendre sur ce qui constitue exactement un agent IA. Au plus simple, un agent IA peut être décrit comme un logiciel alimenté par l’IA qui fait une série de tâches pour vous qu’un agent de service à la clientèle, un employé des ressources humaines ou un employé du service d’assistance informatique aurait pu faire dans le passé, bien qu’il puisse finalement impliquer n’importe quelle tâche. Vous lui demandez de faire des choses, et il les fait pour vous, parfois en traversant plusieurs systèmes et allant bien au-delà de la simple réponse aux questions. Par exemple, Perplexity a récemment lancé un agent IA qui aide les gens à faire leurs achats des fêtes (et ce n’est pas le seul). Et Google a annoncé la semaine dernière son premier agent IA, appelé Project Mariner, qui peut être utilisé pour trouver des vols et des hôtels, faire des achats pour la maison, trouver des recettes, et d’autres tâches.
Ca semble assez simple, non ? Pourtant, la situation est compliquée par un manque de clarté. Même parmi les géants de la technologie, il n’y a pas de consensus. Google les voit comme des assistants basés sur des tâches en fonction du travail : aide au codage pour les développeurs ; aide aux marketeurs pour créer une palette de couleurs ; assiste un professionnel de l’informatique à trouver un problème en interrogeant les données de connexion. Pour Asana, un agent peut agir comme un employé supplémentaire, s’occupant des tâches assignées comme tout bon collègue. Sierra, une start-up fondée par l’ancien co-PDG de Salesforce, Bret Taylor et le vétéran de Google, Clay Bavor, voit les agents comme des outils d’expérience client, aidant les gens à réaliser des actions qui vont bien au-delà des chatbots d’autrefois pour aider à résoudre des ensembles de problèmes plus complexes.
“L’industrie travaille vers cet objectif d’agents opérant indépendamment. “Comme je pense à l’avenir des agents, je veux voir et j’espère voir des agents qui sont vraiment autonomes et capables de prendre des objectifs abstraits et d’en déduire toutes les étapes individuelles nécessaires en toute indépendance,” a déclaré Fred Havemeyer, chef de la recherche en IA et logiciels aux États-Unis chez Macquarie US Equity Research.”
Ce manque d’une définition cohésive laisse de la place pour la confusion sur ce que ces choses vont exactement faire, mais quelle que soit la façon dont elles sont définies, les agents sont là pour aider à accomplir des tâches de manière automatisée avec le moins d’interaction humaine possible. Rudina Seseri, fondatrice et associée chez Glasswing Ventures, dit qu’il est encore tôt et que cela pourrait expliquer le manque d’accord. “Il n’y a pas une seule définition de ce qu’est un ‘agent IA’. Cependant, la vision la plus fréquente est qu’un agent est un système logiciel intelligent conçu pour percevoir son environnement, le raisonner, prendre des décisions et prendre des actions pour atteindre des objectifs spécifiques de manière autonome”, a-t-elle dit à TechCrunch. Elle dit qu’ils utilisent un certain nombre de technologies IA pour y parvenir. “Ces systèmes intègrent diverses techniques IA/ML comme le traitement du langage naturel, l’apprentissage automatique, et la vision par ordinateur pour opérer dans des domaines dynamiques, de manière autonome ou aux côtés d’autres agents et utilisateurs humains.”
Aaron Levie, co-fondateur et PDG de Box, explique qu’avec le temps, à mesure que l’IA devient plus capable, les agents IA seront capables de faire beaucoup plus au nom des humains, et il y a déjà des dynamiques à l’œuvre qui vont pousser cette évolution. “Avec les agents IA, il y a de multiples composantes à un volant d’inertie auto-renforçant qui servira à améliorer de manière spectaculaire ce que les agents IA peuvent accomplir à court et à long terme: le prix/performance du GPU, l’efficacité du modèle, la qualité et l’intelligence du modèle, les améliorations des infrastructures et des cadres IA”, écrit Levie récemment sur LinkedIn. C’est une perspective optimiste sur la technologie qui suppose que la croissance se produira dans tous ces domaines, ce qui n’est pas nécessairement une donnée. Rodney Brooks, pionnier de la robotique au MIT, a souligné dans une récente interview à TechCrunch que l’IA doit affronter des problèmes beaucoup plus difficiles que la plupart des technologies et ne croîtra pas nécessairement de la même manière rapide que, disons, les puces selon la loi de Moore. “Quand un humain voit un système IA effectuer une tâche, il le généralise immédiatement à des choses qui sont similaires et estime la compétence du système IA; pas seulement la performance sur cela, mais la compétence autour de cela”, a dit Brooks lors de cette interview. “Et ils sont généralement très optimistes, et c’est parce qu’ils utilisent un modèle de performance d’une personne à une tâche.”
Le problème est que franchir les systèmes est difficile, et cela est compliqué par le fait que certains systèmes hérités manquent d’accès de base à l’API. Alors que nous voyons de constantes améliorations auxquelles Levie faisait allusion, faire en sorte que le logiciel accède à de multiples systèmes tout en résolvant les problèmes qu’il peut rencontrer en cours de route pourrait s’avérer plus difficile que beaucoup ne le pensent. Si c’est le cas, tout le monde pourrait surestimer ce que les agents IA devraient être capables de faire. David Cushman, un leader de recherche chez HFS Research, considère que la génération actuelle de bots est plus semblable à celle d’Asana : des assistants qui aident les humains à accomplir certaines tâches dans l’intérêt d’atteindre un certain objectif stratégique défini par l’utilisateur. Le défi est d’aider une machine à gérer les contingences de manière véritablement automatisée, et nous ne sommes clairement pas encore proches de cela. “Je pense que c’est la prochaine étape”, a-t-il déclaré. “C’est là que l’IA opère de manière indépendante et efficace à grande échelle. C’est là que les humains fixent les directives, les garde-fous, et appliquent plusieurs technologies pour sortir l’humain de la boucle – quand tout a été axé sur la mise de l’humain dans la boucle avec GenAI”, a-t-il déclaré. La clé ici, a-t-il dit, est de laisser l’agent IA prendre le contrôle et d’appliquer une vraie automatisation.
Jon Turow, un associé de Madrona Ventures, explique que cela va nécessiter la création d’une infrastructure d’agent IA, une pile technologique conçue spécifiquement pour la création des agents (quelles que soient la façon dont on les définit). Dans un récent blog post, Turow a décrit des exemples d’agents IA travaillant actuellement et comment ils sont construits aujourd’hui. Selon Turow, la prolifération croissante d’agents IA – et il admet aussi que la définition est encore un peu insaisissable – nécessite une pile technologique comme toute autre technologie. “Tout cela signifie que notre industrie a du travail à faire pour construire une infrastructure qui soutient les agents IA et les applications qui s’appuient sur eux”, a-t-il écrit dans son article. “Avec le temps, le raisonnement s’améliorera progressivement, les modèles à la pointe de la technologie en viendront à diriger davantage les flux de travail, et les développeurs voudront se concentrer sur le produit et les données – les choses qui les différencient. Ils veulent que la plate-forme sous-jacente ‘fonctionne simplement’ avec éch