谷歌正在为Chrome浏览器中的Gemini助手引入一项实用新功能——“Select from screen”(屏幕选取)工具。用户点击该工具后,当前标签页将被高亮,并提示“选择任意文本或图片向Gemini提问”。选定内容会以图片形式自动添加到对话输入框中,方便用户快速针对屏幕上的信息发起查询。该功能随Chrome 149版本逐步推送,如果暂时未看到,重启浏览器即可启用。
Chrome版Gemini新增屏幕选取工具 3.5 Flash获电脑操控能力
2026/6/25
Gemini与此同时,谷歌宣布Gemini 3.5 Flash模型现已内置“计算机使用”(computer use)工具,开发者可通过Gemini API或Gemini Enterprise Agent Platform调用。该工具让模型能够直接分析桌面应用界面并执行操作,例如官方示例中,3.5 Flash利用计算机使用能力“分析Gemini应用并返回分类后的功能列表”。这标志着AI模型从单纯的文本生成向主动与环境交互迈出重要一步。
两项更新分别在用户端和开发者端提升了Gemini的实用性:屏幕选取简化了图像输入流程,而计算机使用则为自动化任务和智能代理开辟了新的可能。随着Chrome生态与AI模型的不断融合,这类“所见即所得”的交互方式有望成为未来人机协作的常态。

