El cambio nuevo más digno de atención en Claude 3.5 Sonnet esta vez es que empieza a permitir que el modelo “entienda la pantalla y mueva el ratón”, convirtiendo instrucciones en lenguaje natural en un flujo real de operaciones en el ordenador. Para quienes necesitan automatizar hojas de cálculo, la entrada de datos en la web y la organización de materiales, el límite de lo que puede hacerse con Claude 3.5 Sonnet se ha ampliado de forma notable.
¿Qué es exactamente la “capacidad de operar el ordenador” de Claude 3.5 Sonnet?
Claude 3.5 Sonnet incorpora nuevas ideas de API relacionadas con la operación del ordenador orientadas a desarrolladores: primero percibir la interfaz del ordenador (por ejemplo, capturas de pantalla/estado de la interfaz) y luego descomponer tus requisitos en pasos ejecutables. Puede completar paso a paso cadenas del tipo “abrir el navegador—navegar a la página—localizar el campo de entrada—rellenar el formulario—enviar”, haciendo que la tarea ya no se quede solo en sugerencias textuales.
La clave de este tipo de capacidad no está en “si sabe navegar por internet”, sino en “si sabe actuar según la interfaz”. Claude 3.5 Sonnet está diseñado para seguir tomando decisiones y corrigiendo errores a lo largo de flujos de varios pasos, lo que lo hace adecuado para delegar la automatización de operaciones repetitivas, triviales y propensas a fallos.
¿Para qué escenarios es más adecuado?: hojas de cálculo, back office, pruebas y flujos repetitivos
Si tu trabajo suele atascarse en “copiar y pegar + ir y venir cambiando de página”, Claude 3.5 Sonnet tendrá más valor: extraer campos de materiales locales y rellenarlos en formularios en línea o en hojas de cálculo; introducir información en sistemas de back office siguiendo rutas fijas; repetir un mismo proceso para distintos clientes o distintos lotes de datos.
Para equipos de desarrollo, Claude 3.5 Sonnet también es más adecuado como “ejecutor con herramientas”, por ejemplo, hacer clic paso a paso en un entorno de pruebas, verificar el estado de la página, registrar resultados y luego volcar los puntos anómalos en una lista.
La programación y el uso de herramientas también se refuerzan en paralelo
Además de poder operar el ordenador, Claude 3.5 Sonnet también se ha reforzado en tareas de programación y uso de herramientas; oficialmente se menciona una mejora notable en evaluaciones como HumanEval y SWE-bench Verified. El impacto más directo para ti es: Claude 3.5 Sonnet muestra más disposición a generar código ejecutable conforme a las restricciones, puede respetar mejor los formatos de interfaz y se desvía menos en requisitos de múltiples pasos.
