Le nouveau modèle mondial de Decart peut simuler des heures de conduite photoréaliste — avec quelques réserves

Décart, une startup spécialisée dans l’intelligence artificielle, a présenté mercredi Oasis 3, son dernier modèle interactif capable de générer en temps réel des environnements de conduite photoréalistes. Selon des informations exclusives obtenues par TechCrunch, cette innovation est aujourd’hui accessible via une API, marquant une étape importante dans le domaine des simulations pour véhicules autonomes et d’autres applications physiques de l’IA.

Ce modèle innovant cible initialement les entreprises de véhicules autonomes, qui ont besoin de simuler à grande échelle des scénarios de conduite rares ou extrêmes. Cependant, la stratégie à long terme de Décart vise à toucher un public plus large, notamment les développeurs. En proposant un accès API dès le départ, la société espère construire un écosystème de développeurs autour de ses modèles mondiaux, à l’image de ce qu’a réalisé OpenAI avec ses modèles linguistiques. Dean Leitersdorf, co-fondateur et PDG de Décart, affirme que Oasis 3 est « le premier modèle mondial utilisable que l’on peut réellement programmer » et anticipe l’émergence d’une communauté de développeurs passionnés et innovants.

En ouvrant l’accès à une API, Décart mise sur la création d’une communauté de développeurs susceptibles de transformer la façon dont les environnements simulés sont développés, testés et exploités.

La société dispose déjà d’une communauté de plus de 100 000 développeurs, certains construisant des produits autour de son modèle vidéo en temps réel Lucy, majoritairement dans le commerce électronique et la diffusion en direct. Opérant sur cette base, Oasis 3 exploite cette même architecture pour ses environnements de conduite, permettant des simulations infinies de scénarios variés pour les équipes de développement de véhicules autonomes. À 0,02 dollar par seconde, l’accès à cette API est positionné comme une solution rentable, avec des prix pour les entreprises qui varient selon les cas d’usage.

Malgré la concurrence croissante dans le domaine, notamment avec Google qui a lancé Genie 3, ou World Labs avec Marble, et d’autres startups comme Luma ou Runway dans la génération vidéo, Décart mise sur la photoréalistique exceptionnelle et l’infinité de génération de ses mondes comme principaux différenciateurs. Oasis 3 peut ainsi produire des environnements complexes, multi-caméras, et interactifs, adaptés à la fois pour la formation, le test et la validation des systèmes de conduite autonome — un atout majeur pour la recherche et le développement dans ce secteur.

Pourtant, le modèle présente certaines limites. Lors de tests, il a été observé que la cohérence thématique et la stabilité des environnements se détériorent rapidement lors de simulations prolongées. Par exemple, une scène initiale représentant une rue de New York peut, au fil du temps, devenir de plus en plus abstraite ou dévier de la scène initiale, ce qui pose problème pour des applications nécessitant une fiabilité absolue. De plus, la physique des interactions, notamment la collision entre véhicules, montre encore des lacunes importantes, car le modèle ne parvient pas à simuler correctement toutes les lois physiques en vigueur.

Le fondateur Leitersdorf souligne que ces défis font partie de la recherche en cours. La prochaine version d’Oasis 3 devrait permettre de générer des mondes à partir de vidéos, améliorant ainsi la cohérence et la durabilité des environnements simulés. Le modèle actuel est basé sur une architecture auto-régressive, ce qui oblige à gérer un très grand volume de données pour maintenir la cohérence. L’équipe investit également dans l’optimisation de la mémoire du système pour améliorer la durée des simulations et réduire les coûts de calcul.

Malgré ses limitations, l’ouverture à une communauté de développeurs pourrait transformer radicalement la recherche et le développement dans le domaine de la simulation immersive pour véhicules autonomes et autres applications physiques de l’IA.

Alors que Décart continue d’expérimenter et d’améliorer Oasis 3, il semble que la véritable révolution réside dans la capacité de ses utilisateurs à innover et à repousser les limites actuelles. La société anticipe déjà que de nombreux développeurs exploreront de nouvelles applications, ce qui pourrait accélérer la maturation de cette technologie encore jeune mais prometteuse.

Partagez cet article
article précédent

Le nouvel assistant conversationnel de DoorDash permet de commander via des prompts et des photos

article suivant

La nouvelle application Pool transforme vos captures d’écran en quelque chose d’utile

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Lire plus d'articles