Anthropic lance Claude Sonnet 4.5, un nouveau modèle présenté comme plus performant que GPT-5

7 Min Read


Anthropic, souvent présenté comme le principal rival d’OpenAI dans le monde des startups de l’IA, vient de lancer deux nouveaux modèles : Claude Sonnet 4.5 et Claude Sonnet 4.5 Thinking. Sa cible est une nouvelle fois les développeurs, avec des aptitudes annoncées comme sans équivalent en codage.

« Le meilleur modèle pour coder ». À en croire le billet de blog publié par Anthropic le 29 septembre, la cible de Claude Sonnet 4.5 n’est pas le grand public, mais les développeurs.

L’anti-OpenAI, fondé par des anciens de l’entreprise, est désormais majoritairement utilisé par les créateurs d’applications, qui sont nombreux à délaisser ChatGPT et GPT-5 au profit de Claude Code, l’interface d’Anthropic pour la programmation. Anthropic mise dorénavant sur cet aspect pour se différencier d’OpenAI, alors que la bataille du côté du grand public se joue plutôt entre ChatGPT et Google Gemini.

Claude Sonnet 4.5 : Anthropic creuse encore l’écart pour les développeurs, pour empêcher la hype GPT-5

Au lancement de GPT-5, OpenAI avait grandement mis en avant les aptitudes en code et en mathématiques de ses nouveaux modèles. Mais les développeurs ne se sont pas tous laissés convaincre : certains ne jurent que par Claude et son interface dédiée Claude Code. L’arrivée de la version 4.5 était fortement attendue, alors que l’écart s’était grandement resserré avec OpenAI.

Au programme de Claude Sonnet 4.5, qu’Anthropic décline en deux modèles (4.5 et 4.5 Thinking, qui dispose de capacités de raisonnement), la possibilité pour Claude Code de revenir à un état antérieur, alors que l’outil pouvait avoir tendance à détériorer du code d’une mise à jour à une autre.

Le modèle bat des records sur les bancs d’essai de référence, avec un score de 77,2 % sur SWE-bench Verified, qui teste les capacités de développement, et 61,4 % avec OSWorld, qui teste l’aptitude d’un modèle à contrôler un ordinateur.

Anthropic indique que Claude Sonnet 4.5 peut maintenir son « attention » pendant 30 heures consécutives, ce qui réduit considérablement le nombre d’erreurs et accélère la création de code.

À en croire les chiffres publiés par Anthropic, Claude Sonnet 4.5 est meilleur que GPT-5 et Gemini 2.5 Pro (qui se fait vieux). Le modèle d’OpenAI s’en sort mieux sur certains critères (reconnaissance d’images, mathématiques sans outils, gestion des langues…), mais est derrière sur le code. C’est désormais ce terrain qu’Anthropic souhaite maîtriser : Claude doit être le meilleur modèle pour les développeurs.

Autre nouveauté inattendue, sous la forme d’un projet de recherche, Claude dispose d’une fonction de prévisualisation de logiciel en temps réel, qui génère une application sans code pré-écrit, pour aider un débutant ou un professionnel à représenter une idée. Le service s’appelle « Imagine with Claude ».

Anthropic met en avant les capacités de Claude 4.5 en code. Sur ce terrain, le nouveau modèle surpasse OpenAI et Google.
Anthropic met en avant les capacités de Claude 4.5 en code. Sur ce terrain, le nouveau modèle surpasse OpenAI et Google. // Source : Anthropic

Selon Anthropic, Sonnet 4.5 est aussi un modèle conçu pour ne pas être décevant, avec de nombreuses améliorations en termes d’hallucinations. Seul GPT-5 arrive à son niveau, ce qui replace Anthropic au niveau d’OpenAI.

Fier de son nouveau bébé, Anthropic indique qu’il recommande à tous ses utilisateurs de migrer vers Claude Sonnet 4.5, qui coûte autant que le modèle 4.0 (depuis l’interface Claude, Claude Code ou l’API). Des services tiers, comme Perplexity, permettent déjà de choisir entre Claude Sonnet 4.5 et Claude Sonnet 4.5 Thinking, avec des capacités de raisonnement.

Reste maintenant à Google d’actualiser son propre modèle. Gemini 3.0 fait l’objet de rumeurs insistantes toutes les semaines et pourrait faire beaucoup de mal à OpenAI et à Anthropic. Il faut dire que les progrès de DeepMind, la branche de Google spécialisée dans l’intelligence artificielle, sont remarquables ces derniers temps.

Toute l'actu tech en un clien d'oeil

Toute l’actu tech en un clin d’œil

Ajoutez Numerama à votre écran d’accueil et restez connectés au futur !






Source link

Share This Article
Aucun commentaire

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *