Anthropic은 Opus 4.7을 출시한 지 불과 41일 만에 Claude Opus 4.8을 공식 출시했습니다. 새 모델은 SWE-Bench Pro 벤치마크에서 10점 이상의 차이로 GPT-5.5를 능가했으며, 인공지능 분석 지능 지수(Artificial Analysis Intelligence Index)에서 61.4점으로 1위를 기록해 GPT-5.5의 60.2점을 앞질렀습니다. 이번 버전은 단순한 모델 반복이 아닌 실제 아키텍처 업그레이드로 평가됩니다.
Opus 4.8의 핵심은 동적 워크플로우(Dynamic Workflows) 도구 도입입니다. 이를 통해 Claude가 대규모 작업을 계획하고 수십에서 수백 개의 병렬 하위 에이전트(subagents)로 작업을 분배한 후 출력을 검증하고 완전한 결과를 반환할 수 있습니다. 또한 모델의 정직성(확실성 표현)이 4배 향상되어 사용자에게 자신의 불확실성을 보다 정확하게 전달합니다. 긴 컨텍스트 작업 테스트에서 Opus 4.8은 GPT-5.5 및 Gemini 3.1 Pro보다 훨씬 뛰어난 성능을 보였습니다.

