Anthropic ha lanzado una importante actualización para el modelo Claude 3.5 Sonnet, incorporando una función que le permite controlar directamente la computadora. Ahora Claude ya no es solo un asistente de conversación: puede "ver" la pantalla e interactuar con la interfaz como lo haría un humano, abriendo nuevas posibilidades para la automatización de oficina y la programación.
¿Qué cambios trae la función de ejecución autónoma de Claude?
El núcleo de esta nueva función es una API diseñada por Anthropic que permite a Claude percibir la interfaz del ordenador e interactuar con ella. Los desarrolladores solo necesitan ingresar una instrucción, y Claude la traduce en acciones concretas, como abrir un navegador, rellenar un formulario o verificar una hoja de cálculo.
Según datos oficiales, en la prueba estándar OSWorld, Claude 3.5 Sonnet obtuvo un 14.9 % en comprensión de capturas de pantalla. Aunque está por debajo del nivel humano (70 %-75 %), ya supera a otros modelos de IA. Al ejecutar más pasos, su rendimiento puede mejorar hasta un 22 %.
Cómo usar el control del ordenador de Claude para ser más productivo
Para los usuarios comunes, la capacidad de Claude para manejar el ordenador puede reducir significativamente las tareas manuales tediosas. Por ejemplo, cuando necesitas recopilar información de varias fuentes, solo dile a Claude lo que necesitas y él abrirá automáticamente el software relevante, buscará los datos y completará los campos.

