Anthropic ha actualizado por completo su modelo Claude 3.5 Sonnet, añadiendo la capacidad de controlar ordenadores y logrando avances significativos en codificación. Esta actualización también incluye el nuevo modelo Claude 3.5 Haiku, ampliando su oferta. En este artículo analizamos las características más destacadas.
Claude 3.5 Sonnet ahora permite controlar el ordenador
La actualización más llamativa del nuevo Claude 3.5 Sonnet es su capacidad para controlar un ordenador. Anthropic ha creado una API específica que permite al modelo percibir la interfaz del sistema e interactuar con ella como lo haría un humano. Los desarrolladores pueden integrar esta API para que Claude realice acciones como mover el cursor, hacer clic en botones o rellenar formularios.
En el benchmark OSWorld, Claude 3.5 Sonnet obtuvo un 14,9 % de puntuación en modo solo captura de pantalla, superando claramente a otros sistemas de IA. Aunque todavía presenta ciertos desafíos en acciones como desplazamiento o arrastre, empresas reconocidas como Asana y Replit ya están probando esta funcionalidad. Esta capacidad abre nuevas posibilidades para automatizar flujos de trabajo repetitivos.
Mejora notable en codificación y optimización del rendimiento
El nuevo Claude 3.5 Sonnet ha logrado un salto cualitativo en rendimiento de codificación. En la prueba SWE-bench Verified, su puntuación pasó del 33,4 % de la generación anterior al 49,0 %, superando a modelos de razonamiento como o1-preview. Los primeros comentarios de clientes indican que GitLab, al usar este modelo para tareas de DevSecOps, mejoró su capacidad de razonamiento en un 10 % sin aumentar la latencia.

