Google está implementando una nueva función práctica para el asistente Gemini en el navegador Chrome: la herramienta "Seleccionar desde pantalla" (Select from screen). Al hacer clic en ella, la pestaña actual se resalta y aparece el mensaje "Selecciona cualquier texto o imagen para preguntarle a Gemini". El contenido seleccionado se agrega automáticamente al cuadro de conversación como imagen, lo que permite a los usuarios realizar consultas rápidas sobre la información visible en la pantalla. Esta función se está implementando gradualmente con la versión 149 de Chrome; si aún no la ves, reinicia el navegador para activarla.
Al mismo tiempo, Google ha anunciado que el modelo Gemini 3.5 Flash ahora incluye la herramienta "uso de computadora" (computer use), que los desarrolladores pueden invocar a través de la API de Gemini o la plataforma Gemini Enterprise Agent Platform. Esta herramienta permite que el modelo analice directamente la interfaz de aplicaciones de escritorio y ejecute acciones. Por ejemplo, en el caso oficial, 3.5 Flash utiliza la capacidad de uso de computadora para "analizar la aplicación Gemini y devolver una lista clasificada de funciones". Esto marca un paso importante de los modelos de IA, que pasan de la generación pura de texto a la interacción activa con el entorno.

