Google đang triển khai công cụ mới "Select from screen" (Chọn từ màn hình) cho Gemini trong trình duyệt Chrome. Người dùng chỉ cần nhấp vào nút bên cạnh hộp nhập liệu Gemini để làm nổi bật tab hiện tại và tự do chọn bất kỳ văn bản hoặc hình ảnh nào trên màn hình, nội dung được chọn sẽ tự động thêm vào cuộc trò chuyện. Tính năng này được triển khai dần với phiên bản Chrome 149, nếu chưa thấy ngay, hãy khởi động lại trình duyệt để kích hoạt. Điều này giúp đơn giản hóa quá trình nhập thông tin từ màn hình vào trợ lý AI, phù hợp để đặt câu hỏi nhanh hoặc phân tích các phần tử trên trang.
Đồng thời, Google thông báo mô hình Gemini 3.5 Flash hiện đã tích hợp công cụ "điều khiển máy tính" (computer use) từ bên trong. Các nhà phát triển có thể gọi khả năng này thông qua Gemini API, cho phép mô hình trực tiếp thao tác giao diện – ví dụ tự động phân tích ứng dụng Gemini và trả về danh sách các tính năng đã được phân loại. Điều này có nghĩa là AI không chỉ hiểu nội dung màn hình mà còn có thể mô phỏng hành vi người dùng để thực hiện các tác vụ phức tạp. Hiện tại, khả năng điều khiển máy tính của 3.5 Flash đã được mở cho người dùng API.

