OpenAI a annoncé lundi la sortie d’une nouvelle version de son agent de codage AI, Codex, intitulée GPT-5-Codex. Cette avancée prometteuse permet à l’outil de consacrer son temps de réflexion de manière plus dynamique que les modèles précédents, allant ainsi de quelques secondes à sept heures pour une tâche de codage. Grâce à cette méthode d’approche flexible, GPT-5-Codex se distingue sur des benchmarks de codage agentique, surpassant la performance de ses prédécesseurs.
Ce nouveau modèle est en cours de déploiement au sein des produits Codex, accessibles via un terminal, un IDE, GitHub ou même ChatGPT. Tous les utilisateurs de ChatGPT Plus, Pro, Business, Edu et Enterprise ont désormais la possibilité de l’expérimenter. OpenAI prévoit également de rendre GPT-5-Codex disponible pour les clients d’API dans un avenir proche. Cette mise à jour s’inscrit dans les efforts d’OpenAI pour renforcer la compétitivité de Codex face à des produits concurrents comme Claude Code, Cursor d’Anysphere et GitHub Copilot de Microsoft.
GPT-5-Codex est conçu pour être plus interactif et réactif aux besoins des utilisateurs, offrant ainsi une expérience de codage améliorée.
Le marché des outils de codage AI est devenu particulièrement encombré au cours de l’année écoulée, en raison de la forte demande des utilisateurs. Par exemple, Cursor a franchi le cap des 500 millions de dollars de revenus annuels récurrents au début de 2025, tandis que Windsurf, un éditeur de code similaire, a récemment connu des turbulences lors d’une tentative d’acquisition chaotique qui a fragmenté son équipe entre Google et Cognition.
OpenAI affirme que GPT-5-Codex surpasse également GPT-5 dans le cadre du benchmark SWE-bench Verified, qui évalue les capacités de codage agentique, ainsi qu’un benchmark portant sur les performance des tâches de refactorisation de code à partir de grands dépôts établis. Le modèle a également été entraîné pour effectuer des revues de code, et des ingénieurs logiciels expérimentés ont noté une nette amélioration, avec moins de commentaires incorrects et davantage de « commentaires à fort impact ».
Lors d’un briefing, Alexander Embiricos, responsable du produit Codex chez OpenAI, a souligné que les capacités de réflexion dynamique de GPT-5-Codex étaient à l’origine de cette amélioration significative de performance. Contrairement au modèle GPT-5, qui utilise un routeur pour déterminer la complexité d’une tâche, GPT-5-Codex peut ajuster en temps réel le temps consacré à un problème, offrant ainsi une flexibilité inédite.