Phân tích tính năng mới của Claude 3.5: Nâng cấp toàn diện khả năng điều khiển máy tính và lập trình

Anthropic gần đây đã nâng cấp toàn diện mô hình Claude 3.5 Sonnet, bổ sung khả năng điều khiển máy tính và tiếp tục đạt được bước đột phá mới trong khả năng lập trình. Bản cập nhật còn bao gồm mô hình Claude 3.5 Haiku hoàn toàn mới, làm phong phú thêm dòng sản phẩm của họ. Bài viết này sẽ phân tích những tính năng mới đáng chú ý dành cho độc giả.

Claude 3.5 Sonnet bổ sung khả năng thao tác máy tính

Tính năng nổi bật nhất của Claude 3.5 Sonnet phiên bản mới là khả năng điều khiển máy tính. Anthropic đã xây dựng một API chuyên dụng cho phép mô hình nhận diện giao diện máy tính và tương tác như con người. Nhà phát triển có thể tích hợp API này để Claude thực hiện các thao tác như di chuyển con trỏ, nhấp nút, điền biểu mẫu, v.v.

Trong bài kiểm tra OSWorld, Claude 3.5 Sonnet đạt 14,9% điểm số ở chế độ chỉ chụp màn hình, vượt trội so với các hệ thống AI khác. Dù hiện tại khả năng thao tác máy tính vẫn còn thách thức về cuộn hoặc kéo thả, nhiều doanh nghiệp lớn như Asana và Replit đang thử nghiệm tính năng này. Khả năng đó mở ra cơ hội mới cho tự động hóa các quy trình làm việc lặp đi lặp lại.

Cải thiện vượt bậc khả năng lập trình và tối ưu hiệu suất

Claude 3.5 Sonnet mới đã có bước nhảy vọt về chất lượng trong hiệu suất lập trình. Tại bài kiểm tra SWE-bench Verified, điểm số của mô hình tăng từ 33,4% lên 49,0%, vượt qua nhiều mô hình suy luận bao gồm o1-preview. Phản hồi từ khách hàng sớm cho thấy GitLab, khi sử dụng mô hình này cho các tác vụ DevSecOps, khả năng suy luận đã tăng 10% mà không làm tăng độ trễ.

Ngoài ra, Claude 3.5 Haiku – mô hình thế hệ mới nhanh nhất – cũng thể hiện xuất sắc trong các tác vụ lập trình. Mô hình đạt 40,6% điểm số tại SWE-bench Verified, vượt qua nhiều mô hình công khai khác, đồng thời duy trì chi phí và tốc độ tương đương Haiku thế hệ trước. Những cải tiến này giúp Claude trở nên đáng tin cậy hơn khi xử lý các nhiệm vụ kỹ thuật phần mềm phức tạp.

Các cải tiến hiệu suất khác và lựa chọn mô hình

Ngoài các cập nhật cốt lõi trên, Claude 3.5 Sonnet phiên bản mới còn đạt tiến bộ ở nhiều bài kiểm tra tiêu chuẩn khác. Trong đánh giá TAU-bench, điểm số trong lĩnh vực bán lẻ tăng 6,6 điểm phần trăm, đạt 69,2%. Claude 3.5 Haiku kế thừa ưu điểm chi phí thấp và tốc độ cao, rất phù hợp cho các sản phẩm hướng tới người dùng hoặc các tình huống yêu cầu phản hồi nhanh.

Hiện tại Claude 3.5 Sonnet đã mở cửa cho tất cả người dùng, nhà phát triển có thể truy cập qua Anthropic API hoặc các nền tảng như Amazon Bedrock. Bản nâng cấp này không chỉ củng cố vị thế dẫn đầu của Claude trong lĩnh vực lập trình, mà còn đánh dấu bước tiến quan trọng của mô hình AI trong việc thực sự hiểu và thao tác với thế giới số.

Claude 3.5 Sonnet bổ sung khả năng thao tác máy tính

Cải thiện vượt bậc khả năng lập trình và tối ưu hiệu suất

Các cải tiến hiệu suất khác và lựa chọn mô hình

Tìm kiếm bài viết

Bài viết phổ biến

Các Prompt ChatGPT Tốt Nhất: Cách Dùng Để Tăng Hiệu Suất Gấp 10 Lần

Tổng hợp mã lỗi phát nhạc Spotify và cách khắc phục nhanh chóng