Google 正在為 Chrome 瀏覽器中的 Gemini 助手帶來一項實用的新功能——「Select from screen」(螢幕選取)。該工具允許用戶快速將當前標籤頁中的任意文字或圖片添加到提示框中。只需點擊選單中的「Select from screen」,高亮當前標籤頁後選擇目標區域,所選內容便會自動填入 Gemini 的提問框。這項功能已隨 Chrome 149 版本逐步推送,若未立即看到,重新啟動瀏覽器即可啟用。
與此同時,Google 宣布 Gemini 3.5 Flash 模型現已內建「電腦操控」(computer use)能力。開發者可透過 Gemini API 呼叫該能力,讓模型在虛擬環境中執行分析、分類等操作。官方範例中,3.5 Flash 利用此功能「分析 Gemini 應用並返回功能分類列表」。這標誌著 AI 從被動應答向主動操作介面的重要一步,為自動化測試、資料收集等場景開闢了新可能。

