Chrome Gemini 推出螢幕選擇新功能，3.5 Flash 開放電腦操控能力

Google 近期為 Chrome 瀏覽器中的 Gemini 助手推出了全新的「Select from screen」功能。該工具允許使用者直接在當前標籤頁中框選任意文字或圖像，並快速將其新增至提問框中。使用者只需高亮頁面後選擇內容，即可讓 Gemini 據此進行回答或處理。該功能隨 Chrome 149 版本逐步推送，若未立即看到，重新啟動瀏覽器即可啟用。

與此同時，Google 宣布其 Gemini 3.5 Flash 模型現已內建「電腦使用」能力。開發者可透過 Gemini API 呼叫這一新工具，使模型能夠像人類一樣操作介面、分析應用程式並回傳結構化結果。例如，3.5 Flash 可以利用該功能「分析 Gemini 應用程式並回傳分類後的功能列表」。這為自動化測試、資料抓取等場景提供了更直接的 AI 驅動方案。

此次更新標誌著 Google 在 AI 與瀏覽器深度整合上邁出關鍵一步：對一般使用者而言，「Select from screen」簡化了多模態互動流程；對開發者而言，3.5 Flash 的電腦使用能力則打開了更廣泛的自動化探索空間。隨著這兩種工具逐步落地，AI 的實用性有望進一步提升。

搜尋文章

熱門文章

ChatGPT 最好用的幾個提示詞（Prompt），真正能提升 10 倍效率的用法

Claude Code 安裝總是報錯　手把手教你三步搞定配置難題

ChatGPT Claude Gemini Midjourney輸出翻車的排錯清單和提示詞KISS技巧

高效整合 ChatGPT、Claude、Gemini 與 Midjourney：解決內容輸出不一致與改稿崩潰的工作流程

Spotify播放錯誤代碼總整理與解決攻略