Google lance son propre modèle d’IA ‘raisonnant’ | TechCrunch

Generated with DALL·E 3

Google vient de présenter ce qu’il appelle un nouveau modèle d’IA de “raisonnement”. Cependant, il est à un stade expérimental et nécessite quelques améliorations, selon les premiers tests. Le nouveau modèle, nommé Gemini 2.0 Flash Thinking Experimental, est accessible sur la plateforme de prototypage AI Studio de Google. Une fiche descriptive de ce modèle le présente comme idéal pour la compréhension multimodale, le raisonnement et le codage, avec la capacité de «raisonner sur les problèmes les plus complexes» dans des domaines tels que la programmation, les mathématiques et la physique.

Logan Kilpatrick, responsable produit chez AI Studio, a décrit Gemini 2.0 Flash Thinking Experimental comme «la première étape du voyage de raisonnement de Google». Jeff Dean, directeur scientifique de Google DeepMind, la division de recherche en IA de Google, a déclaré que ce modèle est «entraîné à utiliser la pensée pour renforcer son raisonnement». «Nous constatons des résultats prometteurs lorsque nous augmentons le temps de calcul d’inférence», a déclaré Dean, faisant référence à la quantité de calcul utilisée pour faire fonctionner le modèle pendant qu’il considère une question.

A ce stade, le modèle Gemini 2.0 Experimentation du raisonnement flash demeure une version préliminaire, sans toutefois manquer de démontrer son potentiel à travers une énigme déconcertante impliquant à la fois des indices visuels et textuels.

Construit sur le modèle Gemini 2.0 Flash récemment annoncé par Google, le Gemini 2.0 Flash Thinking Experimental semble être conçu de manière similaire aux modèles de raisonnement d’OpenAI, l’o1 et d’autres. Contrairement à la plupart des IA, les modèles de raisonnement sont efficaces pour se vérifier eux-mêmes, ce qui leur évite certains des pièges qui attirent généralement les modèles d’IA. En revanche, les modèles de raisonnement ont souvent besoin de plus de temps – généralement de quelques secondes à quelques minutes de plus – pour arriver à des solutions.

Donné une indication, le modèle Gemini 2.0 Flash Thinking Experimental fait une pause avant de répondre, en envisageant un certain nombre d’indications connexes et en «expliquant» son raisonnement en cours de route. Après un certain temps, le modèle résume ce qu’il estime être la réponse la plus précise. Mais, il est important de noter que des améliorations sont nécessaires, comme par exemple lorsqu’on lui a demandé combien de “r” il y a dans le mot “strawberry”, il a répondu “deux”.

Partagez cet article
article précédent

Instagram dévoile des outils IA pour modifier les apparences, les arrières-plans dans les vidéos à l’aide de commandes | TechCrunch

article suivant

Les entreprises IA sont-elles maintenant uniquement de la technologie de défense?

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Lire plus d'articles