Nuevas funciones de Claude 3.5: ahora controla tu computadora y mejora su capacidad de codificación

Anthropic ha lanzado una actualización importante para Claude 3.5 Sonnet, que no es un simple parche: ahora la IA puede manejar directamente tu computadora. En pocas palabras, Claude puede ver tu pantalla, mover el ratón e incluso escribir. Al mismo tiempo, el nuevo modelo Claude 3.5 Haiku llega a la velocidad del rayo y destaca en múltiples pruebas de referencia. Esta actualización abre nuevas posibilidades tanto para desarrolladores como para usuarios comunes.

Claude 3.5 Sonnet: usa la computadora como una persona

El punto central de esta actualización es la nueva capacidad de Claude 3.5 Sonnet para controlar la computadora. Anthropic ha creado una API especial que permite a Claude percibir la información de píxeles en la pantalla e interactuar con ella como lo haría una persona. Los desarrolladores pueden integrar esta API para que Claude realice tareas de varios pasos, como "abrir el navegador, iniciar sesión en el correo y enviar un mensaje". En la prueba de referencia OSWorld, Claude 3.5 Sonnet obtuvo un 14,9% de aciertos solo con capturas de pantalla, superando al segundo clasificado por un amplio margen.

Por supuesto, esta función aún está en fase de prueba, y Claude todavía tiene margen de mejora en operaciones precisas como desplazamiento o arrastre. Por ejemplo, puede interrumpir la tarea durante grabaciones largas de pantalla. Sin embargo, empresas como Canva y DoorDash ya están probando esta función de Claude para automatizar flujos de trabajo repetitivos; por ejemplo, Replit la utiliza para construir agentes que revisan aplicaciones automáticamente.

Salto en rendimiento de codificación: liderazgo en la industria

Además de controlar la computadora, la capacidad de codificación de Claude 3.5 Sonnet ha dado un salto cualitativo. Su puntuación en la prueba SWE-bench Verified pasó del 33,4% al 49,0%, superando a muchos modelos públicos, incluidos algunos modelos de razonamiento especializados. Las pruebas de GitLab muestran que el nuevo Claude ofrece un razonamiento más potente para tareas DevSecOps sin aumentar la latencia.

Esto significa que los desarrolladores pueden confiarle tareas complejas de desarrollo de software en varios pasos. En otra prueba de habilidades de programación, HumanEval, Claude 3.5 Sonnet alcanzó un 93,7%, mejorando significativamente su capacidad para manejar problemas de software reales. Para los usuarios que colaboran con frecuencia con IA para escribir código, esta actualización de Claude realmente aporta una mejora tangible en la eficiencia.

Claude 3.5 Haiku: el mejor equilibrio entre velocidad e inteligencia

Junto con Claude 3.5 Sonnet, también se ha presentado el nuevo modelo rápido Claude 3.5 Haiku. Su mayor ventaja radica en el costo y la velocidad, al mismo nivel que la generación anterior de Haiku, pero con un gran salto en inteligencia, comparable incluso al modelo estrella anterior, Claude 3 Opus. En tareas de codificación, Claude 3.5 Haiku obtuvo un 40,6% en SWE-bench Verified, superando a muchos modelos, incluido GPT-4.

Desde el punto de vista del posicionamiento del producto, Claude 3.5 Haiku es ideal para aplicaciones en tiempo real sensibles a la latencia, como productos orientados al usuario, tareas de subagentes o servicios que generan experiencias personalizadas a partir de grandes volúmenes de datos. Si necesitas una velocidad de respuesta muy alta sin sacrificar demasiada inteligencia, este nuevo modelo será una opción con una excelente relación calidad-precio.

Claude 3.5 Sonnet: usa la computadora como una persona

Salto en rendimiento de codificación: liderazgo en la industria

Claude 3.5 Haiku: el mejor equilibrio entre velocidad e inteligencia

Buscar artículos

Artículos Populares

Los mejores prompts para ChatGPT: usos que de verdad pueden multiplicar por 10 la eficiencia

La instalación de Claude Code siempre da error: guía paso a paso para resolver el problema de configuración en tres pasos

Lista de verificación para depurar “salidas fallidas” de ChatGPT, Claude, Gemini y Midjourney, y trucos KISS para prompts

Flujo de Trabajo Eficiente: Integra ChatGPT, Claude, Gemini y Midjourney para Coherencia y Menos Estrés en Revisiones

Guía completa de errores de reproducción en Spotify y cómo solucionarlos