Le lundi, Anthropic a annoncé la sortie d’Opus 4.5, la dernière version de son modèle phare, consolidant ainsi sa position dans le domaine des intelligences artificielles avancées. Cette version marque la fin de la série 4.5, après le lancement de Sonnet 4.5 en septembre et Haiku 4.5 en octobre, et promet de riches améliorations en termes de performance et de fonctionnalités.
Opus 4.5 affiche des performances de pointe sur une variété de benchmarks, notamment ceux liés au codage (SWE-Bench et Terminal-bench), à l’utilisation d’outils (tau2-bench et MCP Atlas) et à la résolution de problèmes généraux (ARC-AGI 2, GPQA Diamond). Notamment, il devient le premier modèle à dépasser 80 % sur SWE-Bench vérifié, un indicateur reconnu dans le domaine de la programmation assistée par intelligence artificielle. Anthropic insiste également sur ses capacités renforcées en utilisation de tableurs et en gestion d’outils, tout en déployant plusieurs produits parallèles pour démontrer ces améliorations dans des contextes concrets.
“Les améliorations en mémoire et en gestion du contexte permettront à Opus 4.5 de soutenir des cas d’usage plus complexes, notamment en scenarios d’agents autonomes.”
En cohérence avec ces avancées technologiques, anthropic va étendre la disponibilité de ses produits Claude pour Chrome et Excel, initialement en phase pilote. L’extension Chrome sera accessible à tous les utilisateurs Max, tandis que le modèle dédié à Excel sera disponible aux abonnés Max, Team et Enterprise. La mise à jour intègre également une gestion accrue de la mémoire pour la prise en charge de contextes longs, impliquant des changements fondamentaux dans la façon dont le modèle conserve et exploite ses informations. Selon Dianne Na Penn, responsable de la gestion produit pour la recherche chez Anthropic, ces améliorations permettent notamment une nouvelle fonctionnalité d’« endless chat », qui autorise la poursuite des conversations sans interruption, même lorsque la mémoire du contexte est saturée, grâce à une compression intelligente.
Ces avancées techniques sont principalement orientées vers des cas d’utilisation agentic, c’est-à-dire lorsque Opus agit comme agent principal et supervise une équipe d’agents secondaires alimentés par Haiku. La gestion du mémoire de travail s’avère essentielle dans ces scénarios, car elle permet au modèle d’explorer des bases de code, de traiter de grands documents et de retrouver d’anciennes informations pour assurer une cohérence dans ses actions.
Face à cette nouvelle version, Opus 4.5 devra également faire face à la concurrence féroce de modèles de dernière génération comme GPT-5.1 d’OpenAI, sorti le 12 novembre, ou encore Gemini 3 de Google, lancé le 18 novembre. Ces innovations dans le secteur soulignent une période de forte compétition dans le développement des intelligences artificielles capables de tâches de plus en plus complexes et spécialisées.
