À peine 41 jours après le lancement d'Opus 4.7, Anthropic dévoile officiellement Claude Opus 4.8. Ce nouveau modèle surpasse GPT-5.5 de plus de 10 points au benchmark SWE-Bench Pro et arrive en tête de l'Artificial Analysis Intelligence Index avec un score de 61,4, devant les 60,2 de GPT-5.5. Il s'agit d'une véritable mise à niveau architecturale, pas d'une simple itération.
Le point fort d'Opus 4.8 est l'introduction des workflows dynamiques (Dynamic Workflows), qui permettent à Claude de planifier des tâches complexes et de les répartir entre des dizaines, voire des centaines de sous-agents parallèles, puis de vérifier les résultats avant de les restituer. Le modèle affiche également une amélioration de l'honnêteté multipliée par 4, c'est-à-dire qu'il exprime plus précisément ses propres incertitudes. Dans les tests de longue durée, Opus 4.8 surpasse nettement GPT-5.5 et Gemini 3.1 Pro.

