Google está introduciendo en Chrome una nueva herramienta para el asistente Gemini llamada "Seleccionar desde la pantalla" (Select from screen). Esta función permite a los usuarios agregar rápidamente cualquier texto o imagen de la pestaña activa al prompt de la conversación. Solo hay que resaltar la pestaña, elegir "Seleccionar desde la pantalla" y enmarcar el contenido deseado; Gemini rellenará automáticamente el campo de entrada con la imagen o el texto seleccionado. Actualmente, la función se despliega gradualmente con la versión Chrome 149. Si no aparece de inmediato, basta con reiniciar el navegador para activarla. Esta actualización simplifica significativamente el flujo de consultas visuales, permitiendo que la IA entienda elementos específicos de la página sin necesidad de capturas de pantalla ni copias manuales.
Al mismo tiempo, Google ha anunciado que el modelo Gemini 3.5 Flash ahora incluye una herramienta integrada de uso de ordenador (computer use). Los desarrolladores pueden invocar esta capacidad directamente en la API de Gemini, permitiendo que el modelo simule interacciones humanas con la interfaz, como navegar por aplicaciones y realizar tareas de análisis. En un ejemplo oficial, 3.5 Flash utiliza esta herramienta para "analizar la aplicación Gemini y devolver una lista de funciones organizadas por categorías". Esto significa que el modelo ya no se limita a la comprensión de texto, sino que puede "ver" y "operar" interfaces gráficas como un humano, abriendo nuevas posibilidades para la automatización de pruebas, asistentes inteligentes y otros escenarios. La capacidad de uso de ordenador de Gemini 3.5 Flash ya está disponible en la API de Gemini a partir de hoy.

