Tiêu đề: Gemini trên Chrome có thêm công cụ chọn màn hình và khả năng điều khiển máy tính nhờ mô hình 3.5 Flash

Google gần đây đã giới thiệu công cụ “Select from screen” (chọn từ màn hình) tiện ích cho trợ lý Gemini trên trình duyệt Chrome. Người dùng chỉ cần nhấp vào công cụ này, có thể làm nổi bật tab hiện tại và tự do chọn bất kỳ văn bản hoặc hình ảnh nào trên đó. Nội dung được chọn sẽ tự động được thêm vào hộp nhắc (prompt) của Gemini. Tính năng hiện đang được triển khai dần như một phần của Chrome 149. Nếu chưa thấy ngay, hãy khởi động lại trình duyệt để trải nghiệm. Công cụ này giúp đơn giản hóa đáng kể quy trình đưa thông tin từ màn hình vào cuộc hội thoại AI, giúp việc đặt câu hỏi trở nên trực quan và hiệu quả hơn.

Đồng thời, Google thông báo rằng mô hình Gemini 3.5 Flash hiện đã được tích hợp khả năng sử dụng máy tính (computer use). Các nhà phát triển có thể gọi mô hình này thông qua Gemini API để nó có thể thao tác giao diện và phân tích nội dung ứng dụng giống như con người. Ví dụ, Gemini 3.5 Flash có thể tự động mở ứng dụng Gemini và trả về danh sách các chức năng đã được phân loại. Bước tiến này đánh dấu sự hiện thực hóa năng lực AI Agent, mở ra những khả năng mới cho các kịch bản như kiểm thử tự động, trợ lý thông minh, v.v.

Nhận xét và triển vọng: Từ công cụ chọn màn hình trên Chrome đến khả năng điều khiển máy tính của mô hình, Google đang thúc đẩy ranh giới tương tác giữa con người và AI trên hai hướng. Đối với người dùng phổ thông, “Select from screen” giúp hạ thấp rào cản sử dụng; đối với nhà phát triển, tính năng sử dụng máy tính hứa hẹn những ứng dụng tự động hóa mạnh mẽ hơn sắp xuất hiện. Trong tương lai, những công cụ như thế này có thể trở thành tiêu chuẩn trên các trình duyệt và trợ lý AI.

Tìm kiếm bài viết

Bài viết phổ biến

Các Prompt ChatGPT Tốt Nhất: Cách Dùng Để Tăng Hiệu Suất Gấp 10 Lần

Tổng hợp mã lỗi phát nhạc Spotify và cách khắc phục nhanh chóng