Anthropic a annoncé le lancement de son dernier modèle d’IA, Claude Opus 4.8. L’entreprise affirme que ce modèle est un collaborateur plus efficace, avec des améliorations dans le codage agentique, le raisonnement multidisciplinaire, l’utilisation agentique d’un ordinateur, le travail de connaissance et l’analyse financière agentique.

Anthropic lance Claude Opus 4.8 avec des progrès en codage et en honnêteté

Les testeurs ont constaté qu’Opus 4.8 était « plus fiable et plus précis dans son jugement » lors de tâches agentiques. Le modèle aurait aussi progressé en matière d’honnêteté.

Un modèle plus prudent et moins affirmatif

Les premiers testeurs rapportent qu’Opus 4.8 signale plus souvent les incertitudes concernant son travail et formule moins d’affirmations non étayées.

Anthropic indique que ses évaluations vont dans le même sens. Elles montrent qu’Opus 4.8 serait environ quatre fois moins susceptible que son prédécesseur de laisser passer sans commentaire des défauts dans du code qu’il a lui-même écrit.

Les évaluations d’alignement suggèrent aussi que le modèle atteint de nouveaux sommets sur des critères prosociaux, comme le soutien à l’autonomie de l’utilisateur et l’action dans son intérêt. Les comportements mal alignés, comme la tromperie, seraient moins fréquents qu’avec Opus 4.7 et proches de ceux de Claude Mythos Preview.

De meilleures performances en codage

Selon les benchmarks d’Anthropic, Opus 4.8 a obtenu un score de 69,2 % sur SWE-Bench Pro, surpassant GPT-5.5 et Gemini 3.1 Pro sur ce test, ainsi que sur plusieurs autres benchmarks.

GPT-5.5 conserverait toutefois l’avantage sur le benchmark de codage dans le terminal.

Le mode rapide d’Opus 4.8 fonctionne aussi 2,5 fois plus vite, tandis que le modèle est désormais trois fois moins cher que les versions précédentes.

De nouvelles fonctions pour les produits Claude

En parallèle du lancement d’Opus 4.8, Anthropic ajoute plusieurs nouvelles fonctionnalités à sa gamme de produits.

Les workflows dynamiques, disponibles en aperçu de recherche, permettent à Claude d’accomplir des tâches plus importantes dans Claude Code. Le modèle peut planifier le travail et lancer des centaines de sous-agents en parallèle au sein d’une même session. Il peut aussi réaliser des migrations à l’échelle d’une base de code couvrant plusieurs centaines de milliers de lignes.

Cette fonctionnalité est disponible dans Claude Code pour les formules Enterprise, Team et Max.

Plus de contrôle sur l’effort de Claude

Dans Claude.ai et Cowork, les utilisateurs peuvent choisir le niveau d’effort que Claude consacre à une réponse.

Avec un réglage plus faible, Claude répond plus vite et consomme plus lentement les limites d’utilisation. Opus 4.8 utilise par défaut un niveau d’effort élevé, qu’Anthropic présente comme le meilleur équilibre entre qualité et expérience utilisateur.

L’API Messages accepte désormais les entrées système directement dans le tableau des messages, ce qui permet aux développeurs de modifier les instructions de Claude au milieu d’une tâche.

Claude Opus 4.8 disponible dès maintenant

Claude Opus 4.8 est disponible partout dès aujourd’hui. Le prix pour une utilisation classique ne change pas par rapport à Opus 4.7.

Anthropic travaille déjà sur des modèles offrant les mêmes capacités qu’Opus 4.8 à un coût plus faible, ainsi que sur une nouvelle catégorie de modèles encore plus intelligents qu’Opus.

L’entreprise indique avoir développé des garde-fous pour Claude Mythos, un modèle actuellement testé auprès d’un petit nombre d’organisations. Anthropic prévoit de rendre les modèles de classe Mythos disponibles à tous ses clients dans les prochaines semaines.