3 min de lecture

Les nouveaux modèles d’IA Claude 4 d’Anthropic peuvent raisonner sur de nombreuses étapes

23 mai 2025

Generated with DALL·E 3

“`html

Lors de sa première conférence des développeurs, jeudi, Anthropic a lancé deux nouveaux modèles d’IA que la startup prétend être parmi les meilleurs de l’industrie, du moins en termes de scores sur des benchmarks populaires. Claude Opus 4 et Claude Sonnet 4, faisant partie de la nouvelle famille de modèles Claude 4, sont capables d’analyser de grands ensembles de données, d’exécuter des tâches à long terme et d’entreprendre des actions complexes, selon l’entreprise. Les deux modèles ont été optimisés pour bien performer dans des tâches de programmation, ce qui les rend particulièrement adaptés à l’écriture et à l’édition de code.

Les utilisateurs payants ainsi que ceux des applications de chatbot gratuites de l’entreprise auront accès à Sonnet 4, mais seuls les utilisateurs payants pourront accéder à Opus 4. Pour l’API d’Anthropic, via la plateforme Bedrock d’Amazon et Google Vertex AI, Opus 4 sera facturé 15 $/75 $ par million de tokens (entrée/sortie) et Sonnet 4 à 3 $/15 $. Les tokens représentent les unités de données avec lesquelles les modèles d’IA travaillent. Un million de tokens équivaut à environ 750 000 mots, soit environ 163 000 mots de plus que “Guerre et Paix”.

Les modèles Claude 4 d’Anthropic arrivent alors que la société cherche à augmenter considérablement ses revenus. Selon des rapports, la startup, fondée par d’anciens chercheurs d’OpenAI, vise à atteindre 12 milliards de dollars de bénéfices d’ici 2027, contre une estimation de 2,2 milliards cette année. Anthropic a récemment sécurisé un crédit de 2,5 milliards de dollars et a levé des milliards auprès d’Amazon et d’autres investisseurs, anticipant l’augmentation des coûts liés au développement de modèles avancés. Les concurrents n’ont pas facilité la tâche d’Anthropic dans la course à l’IA.

Anthropic promet des mises à jour plus fréquentes de ses modèles, offrant un flux constant d’améliorations pour rester à la pointe de la technologie.

Le modèle le plus performant des deux, Opus 4, peut maintenir un “effort concentré” à travers plusieurs étapes d’un flux de travail, selon Anthropic. Sonnet 4, conçu comme un “remplaçant direct” de Sonnet 3.7, fait des progrès en matière de codage et de mathématiques par rapport aux modèles précédents d’Anthropic et suit plus précisément les instructions. La famille Claude 4 est également moins susceptible que Sonnet 3.7 de s’engager dans ce que la société appelle le “reward hacking”, un comportement où les modèles exploitent des raccourcis pour accomplir des tâches.

Cependant, ces améliorations n’ont pas conduit à la création des meilleurs modèles du monde selon chaque critère. Par exemple, bien qu’Opus 4 surpasse les modèles Gemini 2.5 Pro de Google et o3 et GPT-4.1 d’OpenAI sur le benchmark SWE-bench Verified, qui évalue les capacités de codage d’un modèle, il ne peut pas dépasser o3 sur l’évaluation multimodale MMMU ou sur GPQA Diamond, une série de questions de niveau doctorat en biologie, physique et chimie.

Anthropic lance Opus 4 avec des protections renforcées, notamment des détecteurs de contenu nuisible et des défenses en matière de cybersécurité. L’entreprise affirme que ses tests internes montrent qu’Opus 4 pourrait “augmenter considérablement” la capacité de personnes ayant une formation en STEM à obtenir, produire ou déployer des armes chimiques, biologiques ou nucléaires, atteignant la spécification de modèle “ASL-3” d’Anthropic. Les modèles Opus 4 et Sonnet 4 sont également des modèles “hybrides”, capables d’offrir des réponses quasi instantanées et de réfléchir de manière plus approfondie, pour permettre un raisonnement plus approfondi.

Pour rendre les modèles plus adaptés aux programmeurs, Anthropic déploie des mises à jour avancées de Claude Code. Ce dernier, qui permet aux développeurs d’exécuter des tâches spécifiques directement à partir d’un terminal, s’intègre désormais aux environnements de développement intégrés (IDE) et offre un SDK permettant aux développeurs de le connecter avec des applications tierces. Anthropic est bien conscient des défis que présente le codage de logiciels de qualité, mais la promesse d’une augmentation de la productivité en matière de codage incite les entreprises et les développeurs à adopter rapidement ces outils. La startup a récemment annoncé qu’elle s’orientait vers des mises à jour plus fréquentes de ses modèles, visant à fournir un flux constant d’améliorations pour maintenir ses utilisateurs à la pointe de la technologie.

“`

Source: Anthropic’s new Claude 4 AI models can reason over many steps