Chrome Gemini 新增「螢幕選取」功能，3.5 Flash 已可操控電腦

Google 正在為 Chrome 瀏覽器中的 Gemini 助手帶來一項實用的新功能——「Select from screen」（螢幕選取）。該工具允許用戶快速將當前標籤頁中的任意文字或圖片添加到提示框中。只需點擊選單中的「Select from screen」，高亮當前標籤頁後選擇目標區域，所選內容便會自動填入 Gemini 的提問框。這項功能已隨 Chrome 149 版本逐步推送，若未立即看到，重新啟動瀏覽器即可啟用。

與此同時，Google 宣布 Gemini 3.5 Flash 模型現已內建「電腦操控」（computer use）能力。開發者可透過 Gemini API 呼叫該能力，讓模型在虛擬環境中執行分析、分類等操作。官方範例中，3.5 Flash 利用此功能「分析 Gemini 應用並返回功能分類列表」。這標誌著 AI 從被動應答向主動操作介面的重要一步，為自動化測試、資料收集等場景開闢了新可能。

點評：從螢幕選取到電腦操控，Google 正逐步將 Gemini 從「對話助手」升級為「環境感知助手」。前者提升了用戶日常互動的便捷性，後者則為開發者提供了更接近人類操作習慣的自動化方案。隨著這些工具的成熟，AI 與桌面生態的融合將更加緊密。

搜尋文章

熱門文章

ChatGPT 最好用的幾個提示詞（Prompt），真正能提升 10 倍效率的用法

Claude Code 安裝總是報錯　手把手教你三步搞定配置難題

ChatGPT Claude Gemini Midjourney輸出翻車的排錯清單和提示詞KISS技巧

高效整合 ChatGPT、Claude、Gemini 與 Midjourney：解決內容輸出不一致與改稿崩潰的工作流程

Spotify播放錯誤代碼總整理與解決攻略