Chrome Gemini bổ sung công cụ chọn màn hình, 3.5 Flash mở khả năng điều khiển máy tính

Google gần đây đã tung ra tính năng hoàn toàn mới "Select from screen" cho trợ lý Gemini trong trình duyệt Chrome. Công cụ này cho phép người dùng trực tiếp chọn bất kỳ văn bản hoặc hình ảnh trên tab hiện tại và nhanh chóng thêm chúng vào hộp câu hỏi. Chỉ cần làm nổi bật trang rồi chọn nội dung, người dùng có thể yêu cầu Gemini trả lời hoặc xử lý dựa trên đó. Tính năng này được triển khai dần qua phiên bản Chrome 149, nếu chưa thấy ngay, chỉ cần khởi động lại trình duyệt là kích hoạt.

Đồng thời, Google thông báo rằng mô hình Gemini 3.5 Flash giờ đây đã được tích hợp khả năng "sử dụng máy tính". Các nhà phát triển có thể gọi công cụ mới này qua Gemini API, cho phép mô hình thao tác giao diện, phân tích ứng dụng và trả về kết quả có cấu trúc giống như con người. Ví dụ, 3.5 Flash có thể dùng tính năng này để "phân tích ứng dụng Gemini và trả về danh sách chức năng đã được phân loại". Điều này mang đến giải pháp AI trực tiếp hơn cho các tình huống như kiểm thử tự động, khai thác dữ liệu, v.v.

Bản cập nhật này đánh dấu bước tiến quan trọng của Google trong việc tích hợp sâu AI với trình duyệt: đối với người dùng thông thường, "Select from screen" đơn giản hóa quy trình tương tác đa phương thức; đối với nhà phát triển, khả năng sử dụng máy tính của 3.5 Flash mở ra không gian khám phá tự động hóa rộng rãi hơn. Khi hai công cụ này dần được triển khai, tính thực tiễn của AI hứa hẹn sẽ được nâng cao hơn nữa.

Tìm kiếm bài viết

Bài viết phổ biến

Các Prompt ChatGPT Tốt Nhất: Cách Dùng Để Tăng Hiệu Suất Gấp 10 Lần

Tổng hợp mã lỗi phát nhạc Spotify và cách khắc phục nhanh chóng