Meet Twin Labs, une start-up basée à Paris qui souhaite construire un produit d’automatisation pour les tâches répétitives, comme l’incorporation de nouveaux employés à tous vos services internes, la recommande d’articles lorsque vous êtes à court de stock, le téléchargement de rapports financiers sur plusieurs produits SaaS, la prise de contact avec de potentiels prospects et bien d’autres. « Le point de départ de Twin est une idée de science-fiction. Nous avons vu le développement des capacités techniques des LLMs — des modèles de base. Et la question que nous nous sommes posée était de savoir si nous serions capables de nous reproduire en formant un agent d’IA sur la manière dont nous accomplissons nos tâches », a expliqué à TechCrunch Hugo Mercier, co-fondateur et PDG de Twin Labs.
Dans le cas de Twin Labs, le plus intéressant n’est pas ce qu’ils font – améliorer les processus internes – mais comment ils le font. L’entreprise s’appuie sur des modèles multimodaux dotés de capacités de vision, comme le GPT-4 avec Vision (GPT-4V), pour reproduire ce que les humains font habituellement. Avant de se tourner vers les modèles multimodaux, Twin Labs a d’abord essayé de développer des agents autonomes en utilisant les LLM traditionnels. « Nous avons testé beaucoup de choses, nous avons mis en œuvre des articles de recherche, nous avons testé des dépôts GitHub open-source. En fin de compte, les LLMs sont complètement peu fiables. Cela signifie que les LLMs prennent les mauvaises décisions », a déclaré M. Mercier. « À la fin, la tâche n’est pas accomplie ».
Selon lui, le GPT-4V a été formé sur de nombreuses interfaces logicielles différentes et leurs bases de code sous-jacentes, ce qui a ouvert de nouvelles possibilités. « Lorsque vous montrez une interface, il comprend la fonctionnalité derrière le bouton », a déclaré M. Mercier.
Contrairement à Zapier et à d’autres produits d’automatisation, Twin Labs ne s’appuie pas sur des API et la conception de processus multi-étapes compliqués. Twin Labs ressemble davantage à un navigateur web. L’outil peut automatiquement charger des pages web, cliquer sur des boutons et entrer du texte. Par exemple, si vous recrutez quelqu’un, vous devrez peut-être ajouter les informations de cette personne dans votre système de paie, envoyer une invitation à Slack, créer un compte Google Workspace et inviter votre nouvel employé à créer un compte auprès du prestataire d’assurance maladie. Les entreprises conservent généralement une longue liste de tâches et la parcourent à chaque fois qu’elles accueillent un nouveau membre de l’équipe. Ces tâches ne sont pas compliquées, mais il est extrêmement important de les réaliser correctement, dans le bon ordre et en cochant certaines cases spécifiques. C’est pourquoi il sera important de pouvoir former l’assistant IA de Twin Labs en utilisant l’enregistrement d’écran et les descriptions en langage naturel. Mais la start-up n’en est pas encore là – elle travaille pour atteindre cet objectif.
Hugo Mercier et Joao Justi, les deux cofondateurs, ont passé les six derniers mois à construire un prototype de ce produit. Ils ont également levé 3 millions de dollars en financement préliminaire auprès de Betaworks, Motier Ventures et de nombreux investisseurs providentiels, comme Florian Douetteau (Dataiku), Thomas Wolf (HuggingFace), Charles Gorintin (Alan), Mehdi Ghissassi (Deepmind), Romain Huet (OpenAI), Irwan Bello (OpenAI), Romuald Elie (Deepmind), Yan-David Erlich (Weight & Biases), Olivier Pomel (Datadog), Rodolphe Saadé (CMA CGM), Thibaud Elziere (Hexa), Quentin Nickmans (Hexa), Philippe Corrot (Mirakl) et Rand Hindi (Snips, Zama). Il reste encore de nombreux défis à relever pour le système d’agents autonomes de Twin Labs. Par exemple, l’achèvement d’une tâche coûte assez cher – mais les coûts des API et de l’infrastructure baissent rapidement dans le domaine de l’IA. Twin Labs lancera d’abord un produit avec une bibliothèque de tâches pré-formées pour s’assurer de leur bon fonctionnement. Par la suite, la start-up prévoit d’ouvrir sa plateforme pour que les clients puissent créer leurs propres tâches.
Si de nombreuses personnes associent les produits IA à une interface de chatbot, l’approche de Twin Labs est intéressante car c’est une façon innovante d’interagir avec les modèles d’IA. « Nous voulions vraiment aller au cœur de ce que les gens font au quotidien, et comment nous pouvons prendre en charge certaines des choses qui sont un peu une corvée pour eux », a déclaré M. Mercier.