Tính năng mới của Claude 3.5: Nâng cấp toàn diện khả năng điều khiển máy tính và lập trình

Anthropic vừa thực hiện bản cập nhật lớn cho Claude 3.5 Sonnet – đây không phải là một bản vá nhỏ lẻ, mà là trao cho AI khả năng trực tiếp thao tác trên máy tính. Nói một cách đơn giản, Claude giờ đây có thể nhìn thấy màn hình của bạn, di chuyển chuột, thậm chí gõ chữ. Đồng thời, mô hình Claude 3.5 Haiku hoàn toàn mới cũng xuất hiện với tốc độ cực nhanh, đạt điểm số ấn tượng trong nhiều bài kiểm tra chuẩn. Bản cập nhật này mở ra nhiều khả năng sáng tạo mới cho cả nhà phát triển lẫn người dùng thông thường.

Tính năng mới của Claude 3.5 Sonnet: Sử dụng máy tính như con người

Điểm nhấn chính của bản cập nhật là khả năng thao tác máy tính mới được bổ sung trên Claude 3.5 Sonnet. Anthropic đã xây dựng một API chuyên biệt, cho phép Claude nhận diện thông tin pixel trên giao diện màn hình và tương tác giống như con người. Nhà phát triển có thể tích hợp API này để Claude thực hiện các tác vụ đa bước như "mở trình duyệt, đăng nhập email, gửi thư". Trong bài kiểm tra OSWorld, Claude 3.5 Sonnet đạt 14,9% điểm chỉ dựa vào ảnh chụp màn hình, vượt xa vị trí thứ hai.

Tất nhiên, tính năng này hiện vẫn đang trong giai đoạn thử nghiệm, Claude còn hạn chế trong các thao tác tinh vi như cuộn, kéo thả. Ví dụ, nó có thể gián đoạn tác vụ khi ghi màn hình lâu. Tuy nhiên, nhiều công ty như Canva và DoorDash đã bắt đầu thử nghiệm tính năng Claude này để tự động hóa các quy trình lặp đi lặp lại, chẳng hạn Replit sử dụng nó để xây dựng Agent có thể tự động kiểm tra ứng dụng.

Đột phá về hiệu suất lập trình: Dẫn đầu ngành

Ngoài thao tác máy tính, khả năng lập trình của Claude 3.5 Sonnet cũng có bước tiến vượt bậc. Điểm số của nó trong bài kiểm tra SWE-bench Verified đã tăng từ 33,4% lên 49,0%, vượt qua nhiều mô hình công khai khác, bao gồm cả một số mô hình suy luận chuyên dụng. Kết quả thử nghiệm từ GitLab cho thấy Claude phiên bản mới cung cấp khả năng suy luận mạnh hơn cho các tác vụ DevSecOps mà không làm tăng độ trễ.

Điều này có nghĩa là nhà phát triển có thể tự tin giao phó các tác vụ phát triển phần mềm phức tạp nhiều bước cho nó. Trong bài kiểm tra HumanEval đánh giá khả năng lập trình, Claude 3.5 Sonnet đạt 93,7%, khả năng xử lý các vấn đề phần mềm thực tế được cải thiện đáng kể. Đối với những người dùng thường xuyên cộng tác với AI để viết mã, bản cập nhật Claude lần này thực sự mang lại hiệu quả rõ rệt.

Claude 3.5 Haiku: Cân bằng hoàn hảo giữa tốc độ và trí thông minh

Cùng ra mắt với Claude 3.5 Sonnet là mô hình nhanh thế hệ mới Claude 3.5 Haiku. Ưu điểm lớn nhất của nó là chi phí và tốc độ, ngang bằng với Haiku thế hệ trước, nhưng trí thông minh được nâng cao đáng kể, thậm chí có thể sánh ngang với mô hình hàng đầu thế hệ trước Claude 3 Opus. Trong các tác vụ lập trình, Claude 3.5 Haiku đạt 40,6% trên SWE-bench Verified, vượt qua nhiều mô hình khác bao gồm cả GPT-4.

Về định vị sản phẩm, Claude 3.5 Haiku rất phù hợp cho các ứng dụng thời gian thực nhạy cảm với độ trễ, chẳng hạn như sản phẩm hướng đến người dùng, tác vụ phụ (sub-agent), hoặc dịch vụ cần tạo trải nghiệm cá nhân hóa từ lượng lớn dữ liệu. Nếu bạn yêu cầu tốc độ phản hồi cực cao mà không muốn hy sinh quá nhiều trí thông minh, mô hình mới này là lựa chọn có tỷ lệ chi phí – hiệu quả rất tốt.

Tính năng mới của Claude 3.5 Sonnet: Sử dụng máy tính như con người

Đột phá về hiệu suất lập trình: Dẫn đầu ngành

Claude 3.5 Haiku: Cân bằng hoàn hảo giữa tốc độ và trí thông minh

Tìm kiếm bài viết

Bài viết phổ biến

Các Prompt ChatGPT Tốt Nhất: Cách Dùng Để Tăng Hiệu Suất Gấp 10 Lần

Tổng hợp mã lỗi phát nhạc Spotify và cách khắc phục nhanh chóng