Google正在為Chrome瀏覽器中的Gemini助手引入一項實用新功能——「Select from screen」(螢幕選取)工具。用戶點擊該工具後,當前標籤頁將被高亮,並提示「選擇任意文字或圖片向Gemini提問」。選定內容會以圖片形式自動添加到對話輸入框中,方便用戶快速針對螢幕上的資訊發起查詢。該功能隨Chrome 149版本逐步推送,如果暫時未看到,重新啟動瀏覽器即可啟用。
與此同時,Google宣布Gemini 3.5 Flash模型現已內建「computer use」(電腦使用)工具,開發者可透過Gemini API或Gemini Enterprise Agent Platform呼叫。該工具讓模型能夠直接分析桌面應用介面並執行操作,例如官方範例中,3.5 Flash利用電腦使用能力「分析Gemini應用並返回分類後的功能列表」。這標誌著AI模型從單純的文字生成向主動與環境互動邁出重要一步。

