Multiverse Computing pousse ses modèles d’IA compressés dans le grand public

Face à une instabilité financière croissante dans la chaîne d’approvisionnement en intelligence artificielle (IA), notamment avec un taux de défauts des entreprises privées dépassant 9,2 % — un niveau inégalé depuis plusieurs années — la société de capital-risque Lux Capital recommande désormais aux entreprises dépendant de l’IA de faire confirmer par écrit leurs engagements en matière de capacité de calcul. Selon eux, dans un contexte économique incertain, un simple accord de principe ne suffit plus, et il devient crucial de sécuriser ses investissements. Une alternative semble cependant émerger : celle de réduire la dépendance à l’infrastructure de calcul externe, en optant pour des modèles d’IA plus petits, capables de fonctionner directement sur l’appareil de l’utilisateur.

Ces modèles d’IA compacts, qui peuvent tourner localement sans nécessiter de data center ou de cloud, commencent à atteindre une maturité suffisante pour envisager leur adoption. La startup espagnole Multiverse Computing, jusque-là moins visible que ses concurrents, s’inscrit dans cette tendance en proposant des solutions qui mettent en avant cette nouvelle approche d’IA embarquée. Après avoir compressé des modèles provenant de grands laboratoires tels qu’OpenAI, Meta, DeepSeek ou Mistral AI, elle a lancé une application témoignant des capacités de ses modèles comprimés ainsi qu’un portail API permettant aux développeurs d’accéder facilement à ces outils. Cette initiative vise surtout le marché des entreprises, qui recherchent des solutions plus rapides, économiques et respectueuses de la vie privée.

Les modèles compacts de Multiverse offrent une alternative aux grands modèles de langage en mois de coût et en résilience, notamment dans des environnements où la connectivité est limitée ou coûteuse.

L’application CompactifAI, qui porte le nom de la technologie de compression inspirée de la physique quantique de la société, se présente sous forme d’un outil de chat IA similaire à ChatGPT. La particularité est que le modèle Gilda, intégré dans l’application, est si petit qu’il peut fonctionner en local et hors ligne — une véritable avancée pour la protection des données. Cependant, cette solution présente une limite : la capacité des appareils mobiles doit être suffisante en RAM et stockage. Lorsque ce n’est pas le cas, l’application se connecte automatiquement au cloud via une API, ce qui fait perdre l’avantage en termes de confidentialité. Ces limitations suggèrent que CompactifAI n’est pas encore destiné à une utilisation de masse, même si l’objectif principal reste le marché professionnel.

En parallèle, Multiverse Computing propose désormais un portail API en libre-service, permettant aux entreprises d’accéder directement à ses modèles compressés sans passer par des marketplaces comme AWS. Selon le CEO Enrique Lizaso, cette transparence et ce contrôle accru facilitent leur déploiement en production, tout en offrant une surveillance en temps réel de leur utilisation. La réduction des coûts de calcul et la possibilité d’implémenter ces modèles en périphérie de réseau (edge computing) sont parmi les arguments clés pour convaincre les entreprises de s’orienter vers cette nouvelle génération de modèles plus petits, plus rapides et plus économes.

Les avancées récentes de compagnies comme Mistral, qui a lancé Mistral Small 4, illustrent cette tendance. Ce modèle, dernier né de la firme française, est optimisé pour diverses tâches telles que la chat conversationnelle, le codage ou la prise de décision autonome, et peut être personnalisé via leur système Forge. Par ailleurs, Multiverse a récemment présenté HyperNova 60B 2602, un modèle compressé basé sur une version open source d’un GPT-oss-120b, affirmant qu’il offre désormais des réponses plus rapides et à moindres coûts que ses prédécesseurs, surtout dans des workflows de programmation autonome. La petite taille et la capacité d’opérer localement offrent des avantages considérables, notamment dans des zones où la connectivité fait défaut ou dans des secteurs nécessitant une confidentialité renforcée.

Partagez cet article
article précédent

Nvidia construit discrètement un géant multimilliardaire pour rivaliser avec son activité de puces

article suivant

Autonomie des personnes âgées : programme de dépistage préalable et de prévention

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Lire plus d'articles