Chrome Gemini 新增螢幕選取，3.5 Flash 獲得電腦操控能力

Google 正為 Chrome 瀏覽器中的 Gemini 推出全新的「從螢幕選取」（Select from screen）工具。用戶只需在 Gemini 提示框旁點擊該按鈕，即可高亮當前分頁，自由選取螢幕上的任何文字或圖片，所選內容會自動加入對話。此功能隨 Chrome 149 版本逐步推送，若未立即看到，重啟瀏覽器即可啟用。此舉大幅簡化了將螢幕資訊輸入 AI 助手的流程，適合快速提問或分析頁面元素。

與此同時，Google 宣佈 Gemini 3.5 Flash 模型現已內建「電腦操控」（computer use）工具。開發者可透過 Gemini API 呼叫該能力，讓模型直接操作介面——例如自動分析 Gemini 應用並回傳分類後的功能列表。這意味著 AI 不僅能理解螢幕內容，還能模擬用戶行為執行複雜任務。目前 3.5 Flash 的電腦操控功能已對 API 用戶開放。

兩項更新分別面向一般用戶與開發者，共同指向同一個方向：讓 AI 更自然地融入用戶的數位環境。從截取螢幕到主動操作，Gemini 正從問答助手進化為真正的「數位代理」。隨著 Chrome 149 的廣泛部署與 API 能力的開放，未來更多的自動化場景值得期待。

搜尋文章

熱門文章

ChatGPT 最好用的幾個提示詞（Prompt），真正能提升 10 倍效率的用法

Claude Code 安裝總是報錯　手把手教你三步搞定配置難題

ChatGPT Claude Gemini Midjourney輸出翻車的排錯清單和提示詞KISS技巧

高效整合 ChatGPT、Claude、Gemini 與 Midjourney：解決內容輸出不一致與改稿崩潰的工作流程

Spotify播放錯誤代碼總整理與解決攻略