Chrome 內建 Gemini 新增螢幕選取功能，3.5 Flash 模型獲得電腦操控能力

Google 正為 Chrome 瀏覽器中的 Gemini 助手推送一項實用更新——「Select from screen」螢幕選取工具。該功能讓用戶能快速擷取當前分頁中的任意文字或圖片，並直接將其加入 Gemini 的提示框中。操作時，頁面會高亮顯示，用戶只需框選內容，圖片便會自動貼上到輸入區，從而更直觀地發起查詢。此功能隨 Chrome 149 版本逐步上線，若尚未看到，重新啟動瀏覽器即可啟用。

與此同時，Google 宣布 Gemini 3.5 Flash 模型現已內建電腦使用（computer use）工具。開發者可透過 Gemini API 呼叫該能力，使模型能夠像人類一樣操控桌面環境。例如，3.5 Flash 可「開啟 Gemini 應用並回傳分類後的功能列表」，實現對介面元素的分析與互動。這一進展進一步拓展了 AI 在自動化辦公、智慧測試等場景的應用邊界。

從用戶端到開發端，兩項更新分別降低了 AI 的使用門檻與擴展了模型的操作能力。隨著「Select from screen」提升日常問答效率，以及 3.5 Flash 的電腦操控走向實用化，Google 正將 AI 更深度地融入 Chrome 生態與開發工作流程中，未來或催生更多基於視覺與操作的智慧助手應用。

搜尋文章

熱門文章

ChatGPT 最好用的幾個提示詞（Prompt），真正能提升 10 倍效率的用法

Claude Code 安裝總是報錯　手把手教你三步搞定配置難題

ChatGPT Claude Gemini Midjourney輸出翻車的排錯清單和提示詞KISS技巧

高效整合 ChatGPT、Claude、Gemini 與 Midjourney：解決內容輸出不一致與改稿崩潰的工作流程

ChatGPT與Claude總是答非所問？掌握3個提問技巧，讓AI秒懂你的需求