“`html
OpenAI a récemment dévoilé o3-pro, un modèle d’intelligence artificielle que la société prétend être le plus performant qu’elle ait jamais créé. O3-pro est une version améliorée de son modèle de raisonnement o3, lancé plus tôt cette année. Contrairement aux modèles d’IA conventionnels, les modèles de raisonnement abordent les problèmes de manière step-by-step, ce qui leur permet d’opérer de manière plus fiable dans des domaines tels que la physique, les mathématiques et la programmation.
À partir de ce mardi, o3-pro est disponible pour les utilisateurs de ChatGPT Pro et Team, remplaçant le modèle o1-pro. Les utilisateurs de la version Entreprise et Edu auront accès à o3-pro la semaine suivante, selon les déclarations d’OpenAI. Ce modèle est également intégré dans l’API des développeurs d’OpenAI depuis cet après-midi, avec un coût de 20 $ par million de tokens d’entrée et 80 $ par million de tokens de sortie.
Dans sa dernière note de mise à jour, OpenAI a indiqué que, lors d’évaluations par des experts, les examinateurs préféraient systématiquement o3-pro à o3 dans toutes les catégories testées. Les scores d’o3-pro sont particulièrement impressionnants dans des domaines clés comme la science, l’éducation, la programmation, le business et l’assistance à l’écriture. Les évaluateurs ont noté o3-pro pour sa clarté, sa compréhension, sa capacité à suivre des instructions et son exactitude.
O3-pro redéfinit les standards de performance dans le domaine des modèles de raisonnement IA.
Bien qu’o3-pro présente de nombreux avantages, il a aussi ses limites. Les réponses du modèle prennent généralement plus de temps à se compléter comparé à l’ancien modèle o1-pro. De plus, les discussions temporaires avec o3-pro dans ChatGPT sont désactivées pour le moment en raison d’un « problème technique ». Ce modèle ne peut pas générer d’images, et la fonctionnalité Canvas, l’espace de travail propulsé par l’IA d’OpenAI, n’est pas supportée par o3-pro.
Malgré ces limitations, o3-pro obtient des scores impressionnants dans des benchmarks populaires d’IA. Selon les tests internes d’OpenAI, o3-pro surpasse le modèle d’IA le plus performant de Google, Gemini 2.5 Pro, lors de l’évaluation AIME 2024, qui mesure les compétences en mathématiques. O3-pro devance également Claude 4 Opus d’Anthropic sur le GPQA Diamond, un test de connaissance scientifique de niveau doctorat.
“`