Anthropic gần đây đã nâng cấp toàn diện mô hình Claude 3.5 Sonnet, bổ sung khả năng điều khiển máy tính và tiếp tục đạt được bước đột phá mới trong khả năng lập trình. Bản cập nhật còn bao gồm mô hình Claude 3.5 Haiku hoàn toàn mới, làm phong phú thêm dòng sản phẩm của họ. Bài viết này sẽ phân tích những tính năng mới đáng chú ý dành cho độc giả.
Claude 3.5 Sonnet bổ sung khả năng thao tác máy tính
Tính năng nổi bật nhất của Claude 3.5 Sonnet phiên bản mới là khả năng điều khiển máy tính. Anthropic đã xây dựng một API chuyên dụng cho phép mô hình nhận diện giao diện máy tính và tương tác như con người. Nhà phát triển có thể tích hợp API này để Claude thực hiện các thao tác như di chuyển con trỏ, nhấp nút, điền biểu mẫu, v.v.
Trong bài kiểm tra OSWorld, Claude 3.5 Sonnet đạt 14,9% điểm số ở chế độ chỉ chụp màn hình, vượt trội so với các hệ thống AI khác. Dù hiện tại khả năng thao tác máy tính vẫn còn thách thức về cuộn hoặc kéo thả, nhiều doanh nghiệp lớn như Asana và Replit đang thử nghiệm tính năng này. Khả năng đó mở ra cơ hội mới cho tự động hóa các quy trình làm việc lặp đi lặp lại.
Cải thiện vượt bậc khả năng lập trình và tối ưu hiệu suất
Claude 3.5 Sonnet mới đã có bước nhảy vọt về chất lượng trong hiệu suất lập trình. Tại bài kiểm tra SWE-bench Verified, điểm số của mô hình tăng từ 33,4% lên 49,0%, vượt qua nhiều mô hình suy luận bao gồm o1-preview. Phản hồi từ khách hàng sớm cho thấy GitLab, khi sử dụng mô hình này cho các tác vụ DevSecOps, khả năng suy luận đã tăng 10% mà không làm tăng độ trễ.

