Google 近期为 Chrome 浏览器中的 Gemini 助手推出了全新的“Select from screen”功能。该工具允许用户直接在当前标签页中框选任意文本或图像,并快速将其添加至提问框中。用户只需高亮页面后选择内容,即可让 Gemini 据此进行回答或处理。该功能随 Chrome 149 版本逐步推送,若未立即看到,重启浏览器即可激活。
与此同时,Google 宣布其 Gemini 3.5 Flash 模型现已内置“计算机使用”能力。开发者可通过 Gemini API 调用这一新工具,使模型能够像人类一样操作界面、分析应用并返回结构化结果。例如,3.5 Flash 可以利用该功能“分析 Gemini 应用并返回分类后的功能列表”。这为自动化测试、数据抓取等场景提供了更直接的 AI 驱动方案。

