Google está implementando una nueva herramienta llamada “Select from screen” para el asistente Gemini en el navegador Chrome. Esta función permite a los usuarios agregar rápidamente cualquier texto o imagen de la pestaña actual directamente al cuadro de preguntas de Gemini, sin necesidad de realizar capturas de pantalla manuales ni copiar y pegar. Al hacer clic en la herramienta, la pestaña activa se resalta y luego se puede seleccionar el contenido que se desea que Gemini analice. Esta función se está implementando gradualmente como parte de la actualización de Chrome 149. Si el usuario aún no ve la opción, basta con reiniciar el navegador para habilitarla.
Al mismo tiempo, Google ha anunciado que el modelo Gemini 3.5 Flash ahora cuenta con capacidad de uso de computadora. Los desarrolladores pueden invocar esta capacidad a través de la API de Gemini, permitiendo que el modelo controle directamente la interfaz de pantalla para realizar análisis. Los ejemplos muestran que 3.5 Flash puede abrir automáticamente la aplicación Gemini, recorrer su interfaz de funciones y devolver una lista de funciones clasificadas con claridad. Este avance significa que el asistente de IA ya no solo puede entender texto o imágenes, sino también “operar” software como un humano, abriendo nuevas posibilidades para pruebas automatizadas, agentes inteligentes y escenarios RPA. El modelo ya está disponible para su uso en la API de Gemini.

