Google gần đây đã tung ra tính năng hoàn toàn mới "Select from screen" cho trợ lý Gemini trong trình duyệt Chrome. Công cụ này cho phép người dùng trực tiếp chọn bất kỳ văn bản hoặc hình ảnh trên tab hiện tại và nhanh chóng thêm chúng vào hộp câu hỏi. Chỉ cần làm nổi bật trang rồi chọn nội dung, người dùng có thể yêu cầu Gemini trả lời hoặc xử lý dựa trên đó. Tính năng này được triển khai dần qua phiên bản Chrome 149, nếu chưa thấy ngay, chỉ cần khởi động lại trình duyệt là kích hoạt.
Đồng thời, Google thông báo rằng mô hình Gemini 3.5 Flash giờ đây đã được tích hợp khả năng "sử dụng máy tính". Các nhà phát triển có thể gọi công cụ mới này qua Gemini API, cho phép mô hình thao tác giao diện, phân tích ứng dụng và trả về kết quả có cấu trúc giống như con người. Ví dụ, 3.5 Flash có thể dùng tính năng này để "phân tích ứng dụng Gemini và trả về danh sách chức năng đã được phân loại". Điều này mang đến giải pháp AI trực tiếp hơn cho các tình huống như kiểm thử tự động, khai thác dữ liệu, v.v.

