Anthropic vừa thực hiện bản cập nhật lớn cho Claude 3.5 Sonnet – đây không phải là một bản vá nhỏ lẻ, mà là trao cho AI khả năng trực tiếp thao tác trên máy tính. Nói một cách đơn giản, Claude giờ đây có thể nhìn thấy màn hình của bạn, di chuyển chuột, thậm chí gõ chữ. Đồng thời, mô hình Claude 3.5 Haiku hoàn toàn mới cũng xuất hiện với tốc độ cực nhanh, đạt điểm số ấn tượng trong nhiều bài kiểm tra chuẩn. Bản cập nhật này mở ra nhiều khả năng sáng tạo mới cho cả nhà phát triển lẫn người dùng thông thường.
Tính năng mới của Claude 3.5 Sonnet: Sử dụng máy tính như con người
Điểm nhấn chính của bản cập nhật là khả năng thao tác máy tính mới được bổ sung trên Claude 3.5 Sonnet. Anthropic đã xây dựng một API chuyên biệt, cho phép Claude nhận diện thông tin pixel trên giao diện màn hình và tương tác giống như con người. Nhà phát triển có thể tích hợp API này để Claude thực hiện các tác vụ đa bước như "mở trình duyệt, đăng nhập email, gửi thư". Trong bài kiểm tra OSWorld, Claude 3.5 Sonnet đạt 14,9% điểm chỉ dựa vào ảnh chụp màn hình, vượt xa vị trí thứ hai.
Tất nhiên, tính năng này hiện vẫn đang trong giai đoạn thử nghiệm, Claude còn hạn chế trong các thao tác tinh vi như cuộn, kéo thả. Ví dụ, nó có thể gián đoạn tác vụ khi ghi màn hình lâu. Tuy nhiên, nhiều công ty như Canva và DoorDash đã bắt đầu thử nghiệm tính năng Claude này để tự động hóa các quy trình lặp đi lặp lại, chẳng hạn Replit sử dụng nó để xây dựng Agent có thể tự động kiểm tra ứng dụng.
Đột phá về hiệu suất lập trình: Dẫn đầu ngành
Ngoài thao tác máy tính, khả năng lập trình của Claude 3.5 Sonnet cũng có bước tiến vượt bậc. Điểm số của nó trong bài kiểm tra SWE-bench Verified đã tăng từ 33,4% lên 49,0%, vượt qua nhiều mô hình công khai khác, bao gồm cả một số mô hình suy luận chuyên dụng. Kết quả thử nghiệm từ GitLab cho thấy Claude phiên bản mới cung cấp khả năng suy luận mạnh hơn cho các tác vụ DevSecOps mà không làm tăng độ trễ.

