Nueva función de Claude: Guía para que la IA controle tu computadora

Anthropic ha lanzado una importante actualización para el modelo Claude 3.5 Sonnet, incorporando una función que le permite controlar directamente la computadora. Ahora Claude ya no es solo un asistente de conversación: puede "ver" la pantalla e interactuar con la interfaz como lo haría un humano, abriendo nuevas posibilidades para la automatización de oficina y la programación.

¿Qué cambios trae la función de ejecución autónoma de Claude?

El núcleo de esta nueva función es una API diseñada por Anthropic que permite a Claude percibir la interfaz del ordenador e interactuar con ella. Los desarrolladores solo necesitan ingresar una instrucción, y Claude la traduce en acciones concretas, como abrir un navegador, rellenar un formulario o verificar una hoja de cálculo.

Según datos oficiales, en la prueba estándar OSWorld, Claude 3.5 Sonnet obtuvo un 14.9 % en comprensión de capturas de pantalla. Aunque está por debajo del nivel humano (70 %-75 %), ya supera a otros modelos de IA. Al ejecutar más pasos, su rendimiento puede mejorar hasta un 22 %.

Cómo usar el control del ordenador de Claude para ser más productivo

Para los usuarios comunes, la capacidad de Claude para manejar el ordenador puede reducir significativamente las tareas manuales tediosas. Por ejemplo, cuando necesitas recopilar información de varias fuentes, solo dile a Claude lo que necesitas y él abrirá automáticamente el software relevante, buscará los datos y completará los campos.

Actualmente, empresas como Replit, Canva y DoorDash ya están probando esta función. Replit incluso ha desarrollado una herramienta de verificación de aplicaciones que evalúa automáticamente el rendimiento del código durante la programación. Esta capacidad de ejecución autónoma hace que Claude sea ideal para flujos de trabajo repetitivos y con muchos pasos.

Nueva función de Claude: codificación más potente y manejo de tareas multi-paso

Además de la capacidad de controlar el ordenador, esta actualización ha mejorado enormemente la habilidad de codificación de Claude. En la prueba SWE-bench Verified, la puntuación de Claude 3.5 Sonnet saltó del 33.4 % al 49 %, superando a todos los modelos públicos, incluido OpenAI o1-preview.

En la prueba de TAU-bench en el ámbito minorista, la puntuación de Claude también subió del 62.6 % al 69.2 %. Los primeros comentarios de empresas como GitLab y Cognition muestran que el nuevo modelo se desempeña excelentemente en tareas a largo plazo y procesos de desarrollo de software multi-paso, manteniendo un trabajo estable durante horas. Para desarrolladores y usuarios que necesitan manejar tareas complejas de manera eficiente, esta actualización de Claude sin duda merece atención.

¿Qué cambios trae la función de ejecución autónoma de Claude?

Cómo usar el control del ordenador de Claude para ser más productivo

Nueva función de Claude: codificación más potente y manejo de tareas multi-paso

Buscar artículos

Artículos Populares

Los mejores prompts para ChatGPT: usos que de verdad pueden multiplicar por 10 la eficiencia

La instalación de Claude Code siempre da error: guía paso a paso para resolver el problema de configuración en tres pasos

Lista de verificación para depurar “salidas fallidas” de ChatGPT, Claude, Gemini y Midjourney, y trucos KISS para prompts

Flujo de Trabajo Eficiente: Integra ChatGPT, Claude, Gemini y Midjourney para Coherencia y Menos Estrés en Revisiones

Guía completa de errores de reproducción en Spotify y cómo solucionarlos