Claude Opus 4.7 : Anthropic reprend la tête du coding, mais bride volontairement la cybersécurité

2 min de lecture
Tous les articles du blog
Claude Opus 4.7 : Anthropic reprend la tête du coding, mais bride volontairement la cybersécurité

64,3 % sur SWE-bench Pro contre 53,4 % pour son prédécesseur. Anthropic vient de lâcher Claude Opus 4.7 ce 16 avril, et les chiffres parlent d'eux-mêmes. Le nouveau modèle phare, généralement disponible, devance aussi bien GPT-5.4 d'OpenAI que Gemini 3.1 Pro de Google sur plusieurs benchmarks clés.

Claude Opus 4.7 : un bond spectaculaire en coding et en vision

Opus 4.7 surpasse Opus 4.6 en ingénierie logicielle avancée, raisonnement multi-étapes et utilisation d'outils à grande échelle. Le modèle vérifie désormais ses propres résultats avant de les renvoyer, ce qui réduit le besoin de supervision humaine.

Côté vision, la résolution maximale passe de 1,15 mégapixel à environ 3,75 mégapixels. Les coordonnées correspondent enfin pixel par pixel aux captures d'écran, un vrai gain pour l'utilisation autonome d'ordinateurs.

Des capacités cyber volontairement réduites

Voici le détail le plus intéressant : Anthropic a délibérément réduit les capacités de cybersécurité d'Opus 4.7 pendant l'entraînement. Des garde-fous détectent et bloquent automatiquement les requêtes à haut risque. Cette précaution découle directement du projet Glasswing et du modèle Claude Mythos, toujours restreint à quelques partenaires comme Apple, Google et Microsoft.

Les professionnels de la sécurité peuvent demander un accès via le nouveau Cyber Verification Program. Une approche qui préfigure un futur où les fonctions IA les plus puissantes seront accessibles sur justificatif professionnel.

Tarif stable, coût réel en hausse

Le prix reste à 5 $ par million de tokens en entrée et 25 $ en sortie, identique à Opus 4.6. Mais un nouveau tokenizer peut consommer jusqu'à 35 % de tokens supplémentaires pour un même texte. En pratique, la facture par requête peut augmenter sensiblement.

Un nouveau niveau d'effort « xhigh » s'ajoute entre high et max. Claude Code reçoit aussi la commande /ultrareview pour des revues de code approfondies. Opus 4.7 est déjà disponible sur GitHub Copilot en plus de l'API Claude, Amazon Bedrock, Vertex AI et Microsoft Foundry.

Anthropic garde une longueur d'avance, mais la course reste serrée

Sur les benchmarks comparables, Opus 4.7 ne devance GPT-5.4 que de peu. OpenAI conserve l'avantage en recherche agentique (89,3 % contre 79,3 %). Le vrai monstre reste Mythos Preview, avec 77,8 % sur SWE-bench Pro contre 64,3 % pour Opus 4.7. La question pour vous, développeurs : combien de temps avant qu'Anthropic ouvre les vannes de Mythos au grand public ?

MD
Marc Delaunay Marc Delaunay explore les outils d'IA créative, la génération d'images et de vidéos, et leur influence sur la création numérique pour AIxploria.