Claude Opus 4.8 ra mắt: Dynamic Workflows vượt mặt GPT-5.5, dẫn đầu bảng xếp hạng AI

Chỉ 41 ngày sau khi ra mắt Opus 4.7, Anthropic vừa chính thức tung ra Claude Opus 4.8. Mô hình mới đã vượt qua GPT-5.5 với cách biệt hơn 10 điểm trên chuẩn đánh giá SWE-Bench Pro, đồng thời đạt 61,4 điểm trên Artificial Analysis Intelligence Index, dẫn đầu trước GPT-5.5 (60,2 điểm). Phiên bản này được đánh giá là một bước nâng cấp kiến trúc thực sự, không chỉ là một bản cập nhật mô hình thông thường.

Điểm nhấn chính của Opus 4.8 là công cụ Dynamic Workflows (Luồng công việc động), cho phép Claude lập kế hoạch các tác vụ lớn và phân chia công việc cho hàng chục đến hàng trăm subagent (tác tử con) chạy song song, sau đó xác minh đầu ra và trả về kết quả hoàn chỉnh. Ngoài ra, mô hình còn có mức độ trung thực tăng gấp 4 lần, nghĩa là thể hiện chính xác hơn sự không chắc chắn của nó với người dùng. Trong các bài kiểm tra ngữ cảnh dài, Opus 4.8 cho thấy hiệu suất vượt trội so với GPT-5.5 và Gemini 3.1 Pro.

Mô hình mới đã được triển khai đồng thời trên API, claude.ai và Claude Code, với mức giá giữ nguyên so với Opus 4.7: 5 USD/triệu token đầu vào, 25 USD/triệu token đầu ra. Đồng thời, Anthropic đã giảm giá 3 lần cho chế độ Fast Mode dành cho người dùng nhóm, nhằm tăng khả năng cạnh tranh trong các tình huống yêu cầu tốc độ cao. Giới chuyên môn nhận định rằng Dynamic Workflows sẽ định hình lại cách vận hành của các công cụ lập trình AI.

Nhận xét: Việc phát hành nhanh chóng và cải tiến kiến trúc của Opus 4.8 cho thấy Anthropic đang đẩy nhanh khoảng cách công nghệ so với đối thủ. Dynamic Workflows chuyển từ "trí tuệ đơn mô hình" sang "cộng tác đa tác tử", và có thể trở thành hạ tầng cốt lõi cho các ứng dụng AI thế hệ tiếp theo.

Tìm kiếm bài viết

Bài viết phổ biến

Các Prompt ChatGPT Tốt Nhất: Cách Dùng Để Tăng Hiệu Suất Gấp 10 Lần