AnthropicはOpus 4.7のリリースからわずか41日後、最新モデルClaude Opus 4.8を正式に発表しました。新モデルはSWE-Bench Proベンチマークで10ポイント以上の差をつけてGPT-5.5を凌駕し、Artificial Analysis Intelligence Indexでは61.4点を獲得して首位(GPT-5.5は60.2点)に立っています。今回のバージョンは単なるモデル反復ではなく、真のアーキテクチャアップグレードと位置づけられています。
Opus 4.8の最大のハイライトはダイナミックワークフロー(Dynamic Workflows)ツールの導入です。これによりClaudeは大規模タスクを計画し、数十から数百の並列サブエージェントに処理を分散。出力を検証した上で完全な結果を返すことが可能になりました。また、モデルの誠実さ(honesty)は4倍に向上し、自身の不確実性をより正確にユーザーに伝えられるようになっています。長いコンテキストを扱うタスクにおいて、Opus 4.8はGPT-5.5やGemini 3.1 Proを明確に上回るパフォーマンスを示しました。

