‘L’outil agent d’OpenAI pourrait être proche de sa sortie | TechCrunch’

Generated with DALL·E 3

OpenAI pourrait être sur le point de lancer un outil d’intelligence artificielle (IA) qui peut prendre le contrôle de votre ordinateur et effectuer des actions en votre nom. Tibor Blaho, un ingénieur logiciel réputé pour avoir correctement divulgué des produits d’IA à venir, affirme avoir découvert des preuves de l’outil Operator tant attendu d’OpenAI. Des publications telles que Bloomberg ont précédemment rapporté sur Operator, qui serait un système “agentaire” capable de gérer de manière autonome des tâches telles que la rédaction de code et la réservation de voyages.

Selon The Information, OpenAI cible janvier comme mois de sortie d’Operator. Le code découvert par Blaho ce week-end confirme ce rapport. Le client ChatGPT d’OpenAI pour macOS a gagné des options, pour l’instant cachées, pour définir des raccourcis pour “Basculer vers Operator” et “Forcer la fermeture d’Operator”, selon Blaho. Et OpenAI a ajouté des références à Operator sur son site Web, a déclaré Blaho, bien que ces références ne soient pas encore visibles publiquement.

“La prochaine entrée d’OpenAI dans le domaine des agents d’IA intervient alors que des concurrents, y compris Anthropic, Google et d’autres, font des tentatives dans ce secteur naissant. Les agents d’IA peuvent être risqués et spéculatifs, mais les géants de la technologie les présentent déjà comme la prochaine grande chose en matière d’IA.”

Selon Blaho, le site d’OpenAI contient également des tableaux non encore publics comparant les performances d’Operator à d’autres systèmes informatiques utilisant l’IA. Ces tableaux peuvent très bien être des espaces réservés. Mais si les chiffres sont exacts, ils suggèrent que l’Operator n’est pas fiable à 100%, selon la tâche. Sur OSWorld, un référentiel qui tente de reproduire un véritable environnement informatique, “OpenAI Computer Use Agent (CUA)”, qui est peut-être le modèle d’IA alimentant Operator, obtient un score de 38,1%, devant le modèle contrôlant l’ordinateur d’Anthropic, mais bien loin du score de 72,4% obtenu par les humains.

L’OpenAI CUA surpasse les performances humaines sur WebVoyager, qui évalue la capacité d’une IA à naviguer et à interagir avec les sites web. Mais le modèle est à la traîne par rapport aux scores de niveau humain sur un autre benchmark Web, WebArena, selon les benchmarks divulgués. Operator a également du mal avec les tâches qu’un humain pourrait facilement accomplir, si la fuite est à croire. En un test qui demandait à Operator de s’inscrire auprès d’un fournisseur de cloud et de lancer une machine virtuelle, Operator a réussi seulement 60% du temps. Chargé de créer un portefeuille Bitcoin, Operator a réussi seulement 10% du temps.

Nous avons contacté OpenAI pour obtenir des commentaires et mettrons à jour cet article si nous obtenons une réponse. Parmi les autres révélations, on trouve un graphique divulgué montrant Operator bien performant sur certaines évaluations de sécurité choisies, y compris les tests qui essayent de faire faire à l’Operator des “activités illicites” et de rechercher des “données personnelles sensibles”. Il semblerait que les tests de sécurité soient une des raisons pour lesquelles le cycle de développement de l’Operator est si long. Kyle Wiggers, un reporter senior à TechCrunch avec un intérêt particulier pour l’intelligence artificielle, a pointé ces informations.

Partagez cet article
article précédent

Envisager le futur de la formation professionnelle grâce à la fiction – Centre Inffo

article suivant

Sylvie Retailleau et Arnaud Ngatcha rejoignent le Cercle Erasmus+ – Centre Inffo

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Lire plus d'articles