Google đang giới thiệu một tính năng hữu ích mới cho trợ lý Gemini trong trình duyệt Chrome – công cụ "Chọn từ màn hình" (Select from screen). Khi người dùng nhấp vào công cụ này, tab hiện tại sẽ được làm nổi bật và hiển thị hướng dẫn "Chọn bất kỳ văn bản hoặc hình ảnh nào để đặt câu hỏi cho Gemini". Nội dung đã chọn sẽ tự động được thêm vào ô nhập hội thoại dưới dạng hình ảnh, giúp người dùng nhanh chóng truy vấn thông tin trên màn hình. Tính năng này đang được triển khai dần theo phiên bản Chrome 149; nếu bạn chưa thấy ngay, hãy khởi động lại trình duyệt để kích hoạt.
Đồng thời, Google công bố mô hình Gemini 3.5 Flash hiện đã được tích hợp công cụ "sử dụng máy tính" (computer use), cho phép các nhà phát triển gọi qua Gemini API hoặc Gemini Enterprise Agent Platform. Công cụ này giúp mô hình phân tích trực tiếp giao diện ứng dụng trên desktop và thực hiện các thao tác – ví dụ trong bản demo chính thức, 3.5 Flash đã dùng khả năng này để "phân tích ứng dụng Gemini và trả về danh sách chức năng đã được phân loại". Đây là bước tiến quan trọng khi mô hình AI không chỉ tạo văn bản mà còn chủ động tương tác với môi trường xung quanh.

