Anthropic gần đây đã tung ra bản cập nhật quan trọng cho mô hình Claude 3.5 Sonnet, bổ sung tính năng tự động thực hiện tác vụ có thể trực tiếp điều khiển máy tính. Điều này có nghĩa là Claude không còn là trợ lý trò chuyện đơn thuần, mà có thể "nhìn" màn hình và thao tác giao diện giống như con người, mang đến khả năng mới cho tự động hóa văn phòng và lập trình.
Những thay đổi mà tính năng tự động thực hiện tác vụ của Claude mang lại
Cốt lõi của tính năng mới này nằm ở API do Anthropic xây dựng riêng, cho phép Claude cảm nhận và tương tác với giao diện máy tính. Nhà phát triển chỉ cần nhập lệnh, Claude sẽ chuyển đổi chúng thành các thao tác máy tính cụ thể, chẳng hạn như mở trình duyệt, điền biểu mẫu hoặc kiểm tra bảng tính.
Theo dữ liệu chính thức, trong bài kiểm tra tiêu chuẩn OSWorld, Claude 3.5 Sonnet đạt 14,9% về khả năng hiểu ảnh chụp màn hình, tuy thấp hơn mức 70-75% của con người nhưng đã vượt qua các mô hình AI khác. Khi thực hiện nhiều bước hơn, điểm số có thể tăng lên 22%.
Cách sử dụng khả năng điều khiển máy tính của Claude để nâng cao hiệu suất làm việc
Đối với người dùng thông thường, khả năng điều khiển máy tính của Claude có thể giảm đáng kể các thao tác thủ công rườm rà. Ví dụ, khi bạn cần tổng hợp thông tin từ nhiều nguồn dữ liệu, chỉ cần nói cho Claude biết yêu cầu, nó sẽ tự động mở phần mềm liên quan, tìm kiếm thông tin và hoàn thành việc điền dữ liệu.

