‘StarCoder 2 est une IA générateur de code qui fonctionne sur la plupart des GPU | TechCrunch’

Generated with DALL·E 3

L’adoption de générateurs de code alimentés par l’IA, tels que GitHub Copilot et Amazon CodeWhisperer, ainsi que des modèles en accès libre comme CodeLlama de Meta, par les développeurs se fait à un rythme impressionnant. Cependant, ces outils sont loin d’être idéaux. Beaucoup ne sont pas gratuits. D’autres le sont, mais uniquement sous des licences qui les excluent de leur utilisation dans des contextes commerciaux courants. Devant la demande pour des alternatives, la start-up d’IA Hugging Face s’est associée il y a plusieurs années à ServiceNow, la plateforme d’automatisation des flux de travail, pour créer StarCoder, un générateur de code open source doté d’une licence moins restrictive que certains des autres existants. La version originale est apparue en début d’année dernière, et le travail est en cours sur une suite, StarCoder 2, depuis lors.

StarCoder 2 n’est pas un seul modèle de génération de code, mais plutôt une famille. Lancé aujourd’hui, il se décline en trois variantes, dont les deux premières peuvent fonctionner sur la plupart des GPUs grand public modernes : un modèle à 3 milliards de paramètres (3B) formé par ServiceNow, un modèle à 7 milliards de paramètres (7B) formé par Hugging Face, et un modèle à 15 milliards de paramètres (15B) formé par Nvidia, le nouveau supporter du projet StarCoder. Comme la plupart des autres générateurs de code, StarCoder 2 peut suggérer des façons de compléter les lignes de code inachevées ainsi que de résumer et de récupérer des extraits de code lorsqu’on lui demande en langage naturel.

“StarCoder 2 a été créé spécialement pour les développeurs qui ont besoin de construire des applications rapidement”, a déclaré Harm de Vries, responsable de l’équipe de développement de StarCoder 2 chez ServiceNow, lors d’une interview accordée à TechCrunch.

Il y a tout de même des bémols. Les générateurs de code promettent d’accélérer certaines tâches de codage, mais cela a un coût. Une étude récente de Stanford a révélé que les ingénieurs qui utilisent des systèmes générant du code sont plus susceptibles d’introduire des vulnérabilités de sécurité dans les applications qu’ils développent. Ailleurs, un sondage de Sonatype, une entreprise de cybersécurité, montre que la majorité des développeurs sont préoccupés par le manque de transparence sur la façon dont le code des générateurs de code est produit et par la “prolifération du code” induite par la production excessive de code par les générateurs.

Tout bien considéré, est-ce que StarCoder 2 est réellement supérieur aux autres générateurs de code sur le marché, qu’ils soient gratuits ou payants ? Selon le benchmark, il semble être plus efficace que l’une des versions de CodeLlama, CodeLlama 33B. Hugging Face affirme que StarCoder 2 15B égale CodeLlama 33B sur un sous-ensemble de tâches de complétion de code à une vitesse deux fois supérieure. Hugging Face n’a pas précisé lesquelles. StarCoder 2 a aussi l’avantage, en tant qu’ensemble de modèles open source, de pouvoir être déployé localement et d'”apprendre” le code source d’un développeur ou sa base de code, séduisant ainsi les développeurs et les entreprises soucieux de ne pas exposer leur code à une IA hébergée dans le cloud.

À la suite de ces informations, on peut se demander quel est l’intérêt pour Hugging Face, ServiceNow et Nvidia d’investir dans un projet comme StarCoder 2. Ce sont des entreprises, après tout, et la formation de modèles n’est pas bon marché. Pour autant que je puisse en juger, il s’agit d’une stratégie éprouvée : favoriser la bonne volonté et construire des services payants sur la base des versions open source. ServiceNow a déjà utilisé StarCoder pour créer Now LLM, un produit de génération de code optimisé pour les modèles de flux de travail, les cas d’utilisation et les processus de ServiceNow. Hugging Face, qui propose des plans de conseil pour l’implémentation de modèles, fournit des versions hébergées des modèles StarCoder 2 sur sa plateforme. Nvidia fait de même, rendant StarCoder 2 accessible via une API et une interface web. Pour les développeurs explicitement intéressés par l’expérience hors ligne sans frais, StarCoder 2 – les modèles, le code source et plus – peut être téléchargé depuis la page GitHub du projet.

Partagez cet article
article précédent

Qu’est-ce que le Workforce Management (WFM) ?

article suivant

Qu’est-ce qu’un organisme de formation Multi-sites ? – Centre Inffo

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Lire plus d'articles