首页平台快讯 GeminiChrome版Gemini新增屏幕选取工具 3.5 Flash获电脑操控能力

Chrome版Gemini新增屏幕选取工具 3.5 Flash获电脑操控能力

2026/6/25

Gemini

谷歌正在为Chrome浏览器中的Gemini助手引入一项实用新功能——“Select from screen”（屏幕选取）工具。用户点击该工具后，当前标签页将被高亮，并提示“选择任意文本或图片向Gemini提问”。选定内容会以图片形式自动添加到对话输入框中，方便用户快速针对屏幕上的信息发起查询。该功能随Chrome 149版本逐步推送，如果暂时未看到，重启浏览器即可启用。

与此同时，谷歌宣布Gemini 3.5 Flash模型现已内置“计算机使用”（computer use）工具，开发者可通过Gemini API或Gemini Enterprise Agent Platform调用。该工具让模型能够直接分析桌面应用界面并执行操作，例如官方示例中，3.5 Flash利用计算机使用能力“分析Gemini应用并返回分类后的功能列表”。这标志着AI模型从单纯的文本生成向主动与环境交互迈出重要一步。

两项更新分别在用户端和开发者端提升了Gemini的实用性：屏幕选取简化了图像输入流程，而计算机使用则为自动化任务和智能代理开辟了新的可能。随着Chrome生态与AI模型的不断融合，这类“所见即所得”的交互方式有望成为未来人机协作的常态。

← 返回Gemini

Chrome版Gemini新增屏幕选取工具 3.5 Flash获电脑操控能力

搜索文章

热门文章

ChatGPT 最好用的几个提示词（Prompt），真正能提升 10 倍效率的用法

Claude Code安装总是报错手把手教你三步搞定配置难题

ChatGPT Claude Gemini Midjourney输出翻车的排错清单和提示词KISS技巧

ChatGPT Claude Gemini加Midjourney联动的高效工作流解决输出不统一和改稿崩溃

ChatGPT和Claude总是答非所问三个提问技巧让AI秒懂你的需求

Chrome版Gemini新增屏幕选取工具 3.5 Flash获电脑操控能力

搜索文章

热门文章

ChatGPT 最好用的几个提示词（Prompt），真正能提升 10 倍效率的用法

Claude Code安装总是报错 手把手教你三步搞定配置难题

ChatGPT Claude Gemini Midjourney输出翻车的排错清单和提示词KISS技巧

ChatGPT Claude Gemini加Midjourney联动的高效工作流 解决输出不统一和改稿崩溃

ChatGPT和Claude总是答非所问 三个提问技巧让AI秒懂你的需求

Claude Code安装总是报错手把手教你三步搞定配置难题

ChatGPT Claude Gemini加Midjourney联动的高效工作流解决输出不统一和改稿崩溃

ChatGPT和Claude总是答非所问三个提问技巧让AI秒懂你的需求