Google đang giới thiệu một công cụ mới có tên "Chọn từ màn hình" (Select from screen) cho trợ lý Gemini trong trình duyệt Chrome. Tính năng này cho phép người dùng nhanh chóng thêm bất kỳ văn bản hoặc hình ảnh nào từ tab hiện tại vào câu lệnh trò chuyện. Chỉ cần tô sáng tab hiện tại, chọn "Chọn từ màn hình" và khoanh vùng nội dung mong muốn, Gemini sẽ tự động điền hình ảnh hoặc văn bản đã chọn vào ô nhập. Hiện tại, tính năng này đang được triển khai dần cùng với phiên bản Chrome 149. Nếu chưa thấy ngay, hãy khởi động lại trình duyệt để kích hoạt. Bản cập nhật này đơn giản hóa đáng kể quy trình truy vấn trực quan, giúp người dùng không cần phải chụp màn hình hay sao chép-dán thủ công, mà vẫn để AI hiểu được các thành phần cụ thể trên trang đang duyệt.
Đồng thời, Google cũng thông báo mô hình Gemini 3.5 Flash hiện đã tích hợp công cụ sử dụng máy tính (computer use). Các nhà phát triển có thể gọi khả năng này trực tiếp trong Gemini API, cho phép mô hình mô phỏng thao tác giao diện người dùng, ví dụ như duyệt qua giao diện ứng dụng và thực hiện các tác vụ phân tích. Trong ví dụ chính thức, 3.5 Flash đã sử dụng công cụ này để "phân tích ứng dụng Gemini và trả về danh sách tính năng được phân loại theo nhóm". Điều này có nghĩa là mô hình không còn giới hạn ở việc hiểu văn bản, mà có thể "nhìn" và "thao tác" giao diện đồ họa giống như con người, mở ra những khả năng mới cho các kịch bản như kiểm thử tự động, trợ lý thông minh. Tính năng sử dụng máy tính của Gemini 3.5 Flash có hiệu lực ngay trên Gemini API từ hôm nay.

