Google正在為Chrome瀏覽器中的Gemini助手推出一項名為「Select from screen」的新工具。該功能允許用戶快速將當前標籤頁中的任意文字或圖像直接添加到Gemini的提問框中,無需手動截圖或複製貼上。當用戶點擊該工具後,當前標籤頁會被高亮,隨後即可框選想要Gemini分析的內容。這項功能作為Chrome 149版本更新的一部分逐步推送,如果用戶尚未看到該選項,重新啟動瀏覽器即可啟用。
與此同時,Google宣布Gemini 3.5 Flash模型現已內建電腦使用能力。開發者可以透過Gemini API呼叫該能力,讓模型直接操控螢幕介面進行分析。範例顯示,3.5 Flash能夠自動開啟Gemini應用程式,遍歷其功能介面,並回傳一份分類清晰的功能列表。這一突破意味著AI助手不再僅能理解文字或圖片,還能像人類一樣「操作」軟體,為自動化測試、智能代理與RPA場景提供了新可能。該模型即日起在Gemini API中開放使用。

