Chrome Gemini新增屏幕选择工具 3.5 Flash开放电脑操控

Google 近期为 Chrome 浏览器中的 Gemini 助手推出了全新的“Select from screen”功能。该工具允许用户直接在当前标签页中框选任意文本或图像，并快速将其添加至提问框中。用户只需高亮页面后选择内容，即可让 Gemini 据此进行回答或处理。该功能随 Chrome 149 版本逐步推送，若未立即看到，重启浏览器即可激活。

与此同时，Google 宣布其 Gemini 3.5 Flash 模型现已内置“计算机使用”能力。开发者可通过 Gemini API 调用这一新工具，使模型能够像人类一样操作界面、分析应用并返回结构化结果。例如，3.5 Flash 可以利用该功能“分析 Gemini 应用并返回分类后的功能列表”。这为自动化测试、数据抓取等场景提供了更直接的 AI 驱动方案。

此次更新标志着 Google 在 AI 与浏览器深度整合上迈出关键一步：对普通用户而言，“Select from screen”简化了多模态交互流程；对开发者而言，3.5 Flash 的计算机使用能力则打开了更广泛的自动化探索空间。随着这两种工具逐步落地，AI 的实用性有望进一步提升。

搜索文章

热门文章

ChatGPT 最好用的几个提示词（Prompt），真正能提升 10 倍效率的用法

Claude Code安装总是报错手把手教你三步搞定配置难题

ChatGPT Claude Gemini Midjourney输出翻车的排错清单和提示词KISS技巧

ChatGPT Claude Gemini加Midjourney联动的高效工作流解决输出不统一和改稿崩溃

Spotify播放错误代码汇总与解决指南