Chỉ 41 ngày sau khi ra mắt Opus 4.7, Anthropic vừa chính thức tung ra Claude Opus 4.8. Mô hình mới đã vượt qua GPT-5.5 với cách biệt hơn 10 điểm trên chuẩn đánh giá SWE-Bench Pro, đồng thời đạt 61,4 điểm trên Artificial Analysis Intelligence Index, dẫn đầu trước GPT-5.5 (60,2 điểm). Phiên bản này được đánh giá là một bước nâng cấp kiến trúc thực sự, không chỉ là một bản cập nhật mô hình thông thường.
Điểm nhấn chính của Opus 4.8 là công cụ Dynamic Workflows (Luồng công việc động), cho phép Claude lập kế hoạch các tác vụ lớn và phân chia công việc cho hàng chục đến hàng trăm subagent (tác tử con) chạy song song, sau đó xác minh đầu ra và trả về kết quả hoàn chỉnh. Ngoài ra, mô hình còn có mức độ trung thực tăng gấp 4 lần, nghĩa là thể hiện chính xác hơn sự không chắc chắn của nó với người dùng. Trong các bài kiểm tra ngữ cảnh dài, Opus 4.8 cho thấy hiệu suất vượt trội so với GPT-5.5 và Gemini 3.1 Pro.

