Petite startup Arcee AI a construit un LLM open source de 400 milliards de paramètres pour surpasser Meta’s Llama

Alors que la majorité des experts de l’industrie estiment que les gagnants du marché des modèles d’intelligence artificielle sont déjà désignés, notamment avec la domination des géants de la tech comme Google, Meta, Microsoft et Amazon, la startup Arcee AI remet en question cette idée. Malgré ses modestes effectifs de seulement 30 employés, cette jeune entreprise a récemment lancé Trinity, un modèle de fondation généraliste, totalement open source sous licence Apache. Avec ses 400 milliards de paramètres, Trinity se positionne comme l’un des plus grands modèles open source jamais entraînés par une entreprise américaine.

Selon Arcee, Trinity rivalise avec des modèles tels que le Llama 4 Maverick de Meta et le GLM-4.5 de Z.ai, développé par l’Université Tsinghua en Chine, selon des benchmarks réalisés sur des modèles de base, c’est-à-dire avec peu de post-entraînement. Bien que Trinity, pour l’instant, se limite principalement aux textes, il reste optimisé pour le codage et les processus multi-étapes comme la gestion d’agents intelligents. La société prévoit d’ajouter des modes supplémentaires, notamment une version vision et une version speech-to-text, témoignant de ses ambitions de développement multimodal.

Malgré sa taille, Trinity cherche à impressionner ses cibles principales : développeurs et chercheurs, en misant sur une ouverture totale et une licence pérenne.

Les tests de benchmarks montrent que Trinity, en version preview, se montre parfois supérieur à Llama 4 Maverick dans des domaines tels que le codage, les mathématiques, le raisonnement et la connaissance générale. La progression d’Arcee dans cette voie est remarquable, surtout si l’on considère qu’elle a réussi à former ses modèles en seulement six mois pour un coût de 20 millions de dollars, avec une infrastructure de 2 048 GPU Nvidia Blackwell B300. Ce financement, bien que conséquent, reste inférieur aux budgets colossaux de certains grands laboratoires, mais illustre la formidable ambition de cette startup ambitieuse.

Le fondateur et CEO d’Arcee, Mark McQuade, explique que l’origine de l’entreprise remonte à une activité de personnalisation de modèles pour des clients du secteur enterprise, notamment via la post-formation de modèles comme Llama ou Qwen. Rapidement, la croissance du client et la montée en puissance des modèles open source en provenance de Chine ont motivé la nécessité de développer leur propre modèle, en particulier face aux restrictions liées à l’utilisation de modèles étrangers dans les entreprises américaines. La décision de développer Trinity découle aussi de leur engagement en faveur d’un modèle totalement open source et libre, contrairement à certains concurrents comme Meta, qui a indiqué récemment qu’il pourrait limiter l’accessibilité de ses modèles les plus avancés.

Selon McQuade, la véritable force de Trinity réside dans sa licence Apache, garantissant une ouverture permanente. Cela offre aux développeurs et aux entreprises une alternative crédible et libre, à l’oppose de Llama, dont Meta reste propriétaire et soumise à des restrictions d’usage. La version la plus grande de Trinity sera disponible en trois formes : une version preview destinée à suivre les instructions humaines, une version base sans post-entraînement, et une version TrueBase entièrement prête à la personnalisation.

Arcee AI s’impose comme un acteur majeur en proposant un modèle open source pionnier, capable de rivaliser avec les poids lourds et de prendre le contre-pied des stratégies propriétaires.

La société prévoit également de proposer prochainement une version hébergée de Trinity avec une tarification concurrentielle, et continue d’affiner ses capacités de raisonnement. Le prix de son API pour la version Mini est fixé à 0,045 $/0,15 $, avec un accès gratuit limité. En plus du modèle principal, Arcee maintient ses options de personnalisation et de post-formation, offrant ainsi une flexibilité que peu d’acteurs du secteur peuvent égaler.

Partagez cet article
article précédent

Réseau Canopé : Samuel Vitel prend la tête d’un acteur clé de la formation continue des enseignants – Centre Inffo

article suivant

Expert en mécanique des fluides ou en écoconception… De plus en plus d’entreprises recherchent des “compétences vertes” chez les candidats (et elles sont très techniques)

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Lire plus d'articles