Google đang triển khai bản cập nhật thiết thực cho trợ lý Gemini trong trình duyệt Chrome – công cụ "Chọn từ màn hình" (Select from screen). Tính năng này cho phép người dùng nhanh chóng chụp bất kỳ văn bản hoặc hình ảnh nào trên tab hiện tại và thêm trực tiếp vào hộp nhập của Gemini. Khi thao tác, trang web sẽ được làm nổi bật, người dùng chỉ cần khoanh vùng nội dung mong muốn, hình ảnh sẽ tự động dán vào khu vực nhập liệu, giúp đặt câu hỏi một cách trực quan hơn. Tính năng này đang được triển khai dần theo phiên bản Chrome 149. Nếu chưa thấy, bạn chỉ cần khởi động lại trình duyệt là có thể kích hoạt.
Đồng thời, Google công bố mô hình Gemini 3.5 Flash hiện đã tích hợp sẵn công cụ điều khiển máy tính (computer use). Các nhà phát triển có thể gọi khả năng này thông qua Gemini API, cho phép mô hình tương tác và thao tác với môi trường desktop giống như con người. Ví dụ, 3.5 Flash có thể "mở ứng dụng Gemini và trả về danh sách tính năng đã được phân loại", thực hiện phân tích và tương tác với các thành phần giao diện. Bước tiến này mở rộng thêm ranh giới ứng dụng của AI trong các lĩnh vực như tự động hóa văn phòng, kiểm thử thông minh, v.v.

