Hướng dẫn điều khiển máy tính bằng AI: Tính năng mới Claude tự động thực hiện tác vụ

Anthropic gần đây đã tung ra bản cập nhật quan trọng cho mô hình Claude 3.5 Sonnet, bổ sung tính năng tự động thực hiện tác vụ có thể trực tiếp điều khiển máy tính. Điều này có nghĩa là Claude không còn là trợ lý trò chuyện đơn thuần, mà có thể "nhìn" màn hình và thao tác giao diện giống như con người, mang đến khả năng mới cho tự động hóa văn phòng và lập trình.

Những thay đổi mà tính năng tự động thực hiện tác vụ của Claude mang lại

Cốt lõi của tính năng mới này nằm ở API do Anthropic xây dựng riêng, cho phép Claude cảm nhận và tương tác với giao diện máy tính. Nhà phát triển chỉ cần nhập lệnh, Claude sẽ chuyển đổi chúng thành các thao tác máy tính cụ thể, chẳng hạn như mở trình duyệt, điền biểu mẫu hoặc kiểm tra bảng tính.

Theo dữ liệu chính thức, trong bài kiểm tra tiêu chuẩn OSWorld, Claude 3.5 Sonnet đạt 14,9% về khả năng hiểu ảnh chụp màn hình, tuy thấp hơn mức 70-75% của con người nhưng đã vượt qua các mô hình AI khác. Khi thực hiện nhiều bước hơn, điểm số có thể tăng lên 22%.

Cách sử dụng khả năng điều khiển máy tính của Claude để nâng cao hiệu suất làm việc

Đối với người dùng thông thường, khả năng điều khiển máy tính của Claude có thể giảm đáng kể các thao tác thủ công rườm rà. Ví dụ, khi bạn cần tổng hợp thông tin từ nhiều nguồn dữ liệu, chỉ cần nói cho Claude biết yêu cầu, nó sẽ tự động mở phần mềm liên quan, tìm kiếm thông tin và hoàn thành việc điền dữ liệu.

Hiện tại, nhiều công ty như Replit, Canva và DoorDash đã bắt đầu thử nghiệm tính năng này. Replit thậm chí còn dùng nó để phát triển công cụ kiểm tra ứng dụng chuyên dụng, tự động đánh giá hiệu suất mã trong quá trình lập trình. Khả năng tự động thực hiện tác vụ này giúp Claude trở nên lý tưởng để xử lý các quy trình làm việc lặp đi lặp lại và nhiều bước.

Tính năng mới của Claude: Xử lý mã và tác vụ đa bước mạnh mẽ hơn

Ngoài khả năng điều khiển máy tính, bản cập nhật lần này còn cải thiện đáng kể năng lực lập trình của Claude. Trong bài kiểm tra SWE-bench Verified, điểm số của Claude 3.5 Sonnet đã tăng từ 33,4% lên 49%, vượt qua tất cả các mô hình công khai khác bao gồm OpenAI o1-preview.

Trong bài kiểm tra lĩnh vực bán lẻ TAU-bench, điểm số của Claude cũng tăng từ 62,6% lên 69,2%. Phản hồi ban đầu từ các doanh nghiệp như GitLab và Cognition cho thấy mô hình mới hoạt động xuất sắc trong các tác vụ dài hạn và quy trình phát triển phần mềm nhiều bước, có thể làm việc ổn định trong nhiều giờ liên tục. Đối với các nhà phát triển và người dùng cần xử lý các tác vụ phức tạp hiệu quả, bản nâng cấp này của Claude chắc chắn đáng để quan tâm.

Những thay đổi mà tính năng tự động thực hiện tác vụ của Claude mang lại

Cách sử dụng khả năng điều khiển máy tính của Claude để nâng cao hiệu suất làm việc

Tính năng mới của Claude: Xử lý mã và tác vụ đa bước mạnh mẽ hơn

Tìm kiếm bài viết

Bài viết phổ biến

Các Prompt ChatGPT Tốt Nhất: Cách Dùng Để Tăng Hiệu Suất Gấp 10 Lần

Tổng hợp mã lỗi phát nhạc Spotify và cách khắc phục nhanh chóng