Google 近期為 Chrome 瀏覽器中的 Gemini 助手推出了全新的「Select from screen」功能。該工具允許使用者直接在當前標籤頁中框選任意文字或圖像,並快速將其新增至提問框中。使用者只需高亮頁面後選擇內容,即可讓 Gemini 據此進行回答或處理。該功能隨 Chrome 149 版本逐步推送,若未立即看到,重新啟動瀏覽器即可啟用。
與此同時,Google 宣布其 Gemini 3.5 Flash 模型現已內建「電腦使用」能力。開發者可透過 Gemini API 呼叫這一新工具,使模型能夠像人類一樣操作介面、分析應用程式並回傳結構化結果。例如,3.5 Flash 可以利用該功能「分析 Gemini 應用程式並回傳分類後的功能列表」。這為自動化測試、資料抓取等場景提供了更直接的 AI 驅動方案。

