Google 正為 Chrome 瀏覽器中的 Gemini 助手推送一項實用更新——「Select from screen」螢幕選取工具。該功能讓用戶能快速擷取當前分頁中的任意文字或圖片,並直接將其加入 Gemini 的提示框中。操作時,頁面會高亮顯示,用戶只需框選內容,圖片便會自動貼上到輸入區,從而更直觀地發起查詢。此功能隨 Chrome 149 版本逐步上線,若尚未看到,重新啟動瀏覽器即可啟用。
與此同時,Google 宣布 Gemini 3.5 Flash 模型現已內建電腦使用(computer use)工具。開發者可透過 Gemini API 呼叫該能力,使模型能夠像人類一樣操控桌面環境。例如,3.5 Flash 可「開啟 Gemini 應用並回傳分類後的功能列表」,實現對介面元素的分析與互動。這一進展進一步拓展了 AI 在自動化辦公、智慧測試等場景的應用邊界。

