Google 正在为 Chrome 浏览器中的 Gemini 助手推送一项实用更新——“Select from screen”屏幕选择工具。该功能允许用户快速截取当前标签页中的任意文本或图像,并将其直接添加至 Gemini 的提示框中。操作时,页面会被高亮,用户只需框选内容,图片便会自动粘贴到输入区,从而更直观地发起查询。此功能随 Chrome 149 版本逐步上线,如果尚未看到,重启浏览器即可启用。
与此同时,Google 宣布 Gemini 3.5 Flash 模型现已内置计算机使用(computer use)工具。开发者可通过 Gemini API 调用该能力,使模型能够像人一样操控桌面环境。例如,3.5 Flash 可“打开 Gemini 应用并返回分类后的功能列表”,实现对界面元素的分析与交互。这一进展进一步拓展了 AI 在自动化办公、智能测试等场景的应用边界。

