Google gần đây đã giới thiệu công cụ “Select from screen” (chọn từ màn hình) tiện ích cho trợ lý Gemini trên trình duyệt Chrome. Người dùng chỉ cần nhấp vào công cụ này, có thể làm nổi bật tab hiện tại và tự do chọn bất kỳ văn bản hoặc hình ảnh nào trên đó. Nội dung được chọn sẽ tự động được thêm vào hộp nhắc (prompt) của Gemini. Tính năng hiện đang được triển khai dần như một phần của Chrome 149. Nếu chưa thấy ngay, hãy khởi động lại trình duyệt để trải nghiệm. Công cụ này giúp đơn giản hóa đáng kể quy trình đưa thông tin từ màn hình vào cuộc hội thoại AI, giúp việc đặt câu hỏi trở nên trực quan và hiệu quả hơn.
Đồng thời, Google thông báo rằng mô hình Gemini 3.5 Flash hiện đã được tích hợp khả năng sử dụng máy tính (computer use). Các nhà phát triển có thể gọi mô hình này thông qua Gemini API để nó có thể thao tác giao diện và phân tích nội dung ứng dụng giống như con người. Ví dụ, Gemini 3.5 Flash có thể tự động mở ứng dụng Gemini và trả về danh sách các chức năng đã được phân loại. Bước tiến này đánh dấu sự hiện thực hóa năng lực AI Agent, mở ra những khả năng mới cho các kịch bản như kiểm thử tự động, trợ lý thông minh, v.v.

