Google 正為 Chrome 瀏覽器中的 Gemini 推出全新的「從螢幕選取」(Select from screen)工具。用戶只需在 Gemini 提示框旁點擊該按鈕,即可高亮當前分頁,自由選取螢幕上的任何文字或圖片,所選內容會自動加入對話。此功能隨 Chrome 149 版本逐步推送,若未立即看到,重啟瀏覽器即可啟用。此舉大幅簡化了將螢幕資訊輸入 AI 助手的流程,適合快速提問或分析頁面元素。
與此同時,Google 宣佈 Gemini 3.5 Flash 模型現已內建「電腦操控」(computer use)工具。開發者可透過 Gemini API 呼叫該能力,讓模型直接操作介面——例如自動分析 Gemini 應用並回傳分類後的功能列表。這意味著 AI 不僅能理解螢幕內容,還能模擬用戶行為執行複雜任務。目前 3.5 Flash 的電腦操控功能已對 API 用戶開放。

