Claude 3.5: Nuevas capacidades de control de PC y codificación avanzada

Anthropic ha actualizado por completo su modelo Claude 3.5 Sonnet, añadiendo la capacidad de controlar ordenadores y logrando avances significativos en codificación. Esta actualización también incluye el nuevo modelo Claude 3.5 Haiku, ampliando su oferta. En este artículo analizamos las características más destacadas.

Claude 3.5 Sonnet ahora permite controlar el ordenador

La actualización más llamativa del nuevo Claude 3.5 Sonnet es su capacidad para controlar un ordenador. Anthropic ha creado una API específica que permite al modelo percibir la interfaz del sistema e interactuar con ella como lo haría un humano. Los desarrolladores pueden integrar esta API para que Claude realice acciones como mover el cursor, hacer clic en botones o rellenar formularios.

En el benchmark OSWorld, Claude 3.5 Sonnet obtuvo un 14,9 % de puntuación en modo solo captura de pantalla, superando claramente a otros sistemas de IA. Aunque todavía presenta ciertos desafíos en acciones como desplazamiento o arrastre, empresas reconocidas como Asana y Replit ya están probando esta funcionalidad. Esta capacidad abre nuevas posibilidades para automatizar flujos de trabajo repetitivos.

Mejora notable en codificación y optimización del rendimiento

El nuevo Claude 3.5 Sonnet ha logrado un salto cualitativo en rendimiento de codificación. En la prueba SWE-bench Verified, su puntuación pasó del 33,4 % de la generación anterior al 49,0 %, superando a modelos de razonamiento como o1-preview. Los primeros comentarios de clientes indican que GitLab, al usar este modelo para tareas de DevSecOps, mejoró su capacidad de razonamiento en un 10 % sin aumentar la latencia.

Además, Claude 3.5 Haiku, el modelo más rápido de la nueva generación, también destaca en tareas de codificación. Obtuvo un 40,6 % en SWE-bench Verified, superando a muchos modelos disponibles públicamente, manteniendo el mismo costo y velocidad que la generación anterior de Haiku. Estas mejoras hacen que Claude sea más fiable para tareas complejas de ingeniería de software.

Otras mejoras de rendimiento y opciones de modelos

Además de las actualizaciones principales, el nuevo Claude 3.5 Sonnet ha progresado en múltiples benchmarks. En la evaluación TAU-bench, su puntuación en el ámbito minorista aumentó 6,6 puntos porcentuales, alcanzando el 69,2 %. Por su parte, Claude 3.5 Haiku mantiene las ventajas de bajo costo y alta velocidad, siendo ideal para productos orientados al usuario o escenarios que requieren respuestas rápidas.

Actualmente, Claude 3.5 Sonnet está disponible para todos los usuarios. Los desarrolladores pueden acceder a él a través de la API de Anthropic o plataformas como Amazon Bedrock. Esta actualización no solo refuerza el liderazgo de Claude en el ámbito de la programación, sino que también marca un paso importante hacia la comprensión y el control real del mundo digital por parte de los modelos de IA.

Claude 3.5 Sonnet ahora permite controlar el ordenador

Mejora notable en codificación y optimización del rendimiento

Otras mejoras de rendimiento y opciones de modelos

Buscar artículos

Artículos Populares

Los mejores prompts para ChatGPT: usos que de verdad pueden multiplicar por 10 la eficiencia

La instalación de Claude Code siempre da error: guía paso a paso para resolver el problema de configuración en tres pasos

Lista de verificación para depurar “salidas fallidas” de ChatGPT, Claude, Gemini y Midjourney, y trucos KISS para prompts

Flujo de Trabajo Eficiente: Integra ChatGPT, Claude, Gemini y Midjourney para Coherencia y Menos Estrés en Revisiones

Guía completa de errores de reproducción en Spotify y cómo solucionarlos