Gemini in Chrome新增屏幕选取工具与3.5 Flash计算机操控能力

谷歌近日为Chrome浏览器中的Gemini助手推出了一项实用的“Select from screen”（从屏幕选取）工具。用户只需点击该工具，即可高亮当前标签页并自由选择任意文本或图像，被选中的内容将自动添加到Gemini的提示框中。这一功能目前作为Chrome 149的一部分逐步推送，若未立即看到，重启浏览器即可体验。它极大简化了将屏幕信息导入AI对话的流程，让提问更加直观高效。

与此同时，谷歌宣布Gemini 3.5 Flash模型现在内置了计算机使用（computer use）能力。开发者可通过Gemini API调用该模型，使其能够像人类一样操作界面、分析应用内容。例如，3.5 Flash可以自动打开Gemini应用并返回分类后的功能列表。这一进展标志着AI代理（AI Agent）能力的进一步落地，为自动化测试、智能助手等场景打开了新可能。

点评与展望：从Chrome的屏幕选取工具到模型的自主操控能力，谷歌正双线推进AI的人机交互边界。对于普通用户，“Select from screen”降低了使用门槛；对于开发者，计算机使用功能则预示着更强大的自动化应用即将涌现。未来，这类工具或许会成为浏览器和AI助手的标配。

搜索文章

热门文章

ChatGPT 最好用的几个提示词（Prompt），真正能提升 10 倍效率的用法

Claude Code安装总是报错手把手教你三步搞定配置难题

ChatGPT Claude Gemini Midjourney输出翻车的排错清单和提示词KISS技巧

ChatGPT Claude Gemini加Midjourney联动的高效工作流解决输出不统一和改稿崩溃

Spotify播放错误代码汇总与解决指南