Chrome tích hợp Gemini: Tính năng chọn màn hình mới, 3.5 Flash hỗ trợ điều khiển máy tính

Google đang triển khai bản cập nhật thiết thực cho trợ lý Gemini trong trình duyệt Chrome – công cụ "Chọn từ màn hình" (Select from screen). Tính năng này cho phép người dùng nhanh chóng chụp bất kỳ văn bản hoặc hình ảnh nào trên tab hiện tại và thêm trực tiếp vào hộp nhập của Gemini. Khi thao tác, trang web sẽ được làm nổi bật, người dùng chỉ cần khoanh vùng nội dung mong muốn, hình ảnh sẽ tự động dán vào khu vực nhập liệu, giúp đặt câu hỏi một cách trực quan hơn. Tính năng này đang được triển khai dần theo phiên bản Chrome 149. Nếu chưa thấy, bạn chỉ cần khởi động lại trình duyệt là có thể kích hoạt.

Đồng thời, Google công bố mô hình Gemini 3.5 Flash hiện đã tích hợp sẵn công cụ điều khiển máy tính (computer use). Các nhà phát triển có thể gọi khả năng này thông qua Gemini API, cho phép mô hình tương tác và thao tác với môi trường desktop giống như con người. Ví dụ, 3.5 Flash có thể "mở ứng dụng Gemini và trả về danh sách tính năng đã được phân loại", thực hiện phân tích và tương tác với các thành phần giao diện. Bước tiến này mở rộng thêm ranh giới ứng dụng của AI trong các lĩnh vực như tự động hóa văn phòng, kiểm thử thông minh, v.v.

Từ phía người dùng đến phía nhà phát triển, hai bản cập nhật này lần lượt hạ thấp rào cản sử dụng AI và mở rộng khả năng thao tác của mô hình. Với "Chọn từ màn hình" nâng cao hiệu quả hỏi đáp hàng ngày, cùng khả năng điều khiển máy tính của 3.5 Flash dần đi vào thực tiễn, Google đang tích hợp AI sâu hơn vào hệ sinh thái Chrome và quy trình phát triển, hứa hẹn trong tương lai sẽ tạo ra nhiều ứng dụng trợ lý thông minh dựa trên thị giác và thao tác hơn nữa.

Tìm kiếm bài viết

Bài viết phổ biến

Các Prompt ChatGPT Tốt Nhất: Cách Dùng Để Tăng Hiệu Suất Gấp 10 Lần