Claude 3.5 estrena 'Uso de Computadora': Mira, haz clic y escribe como un asistente humano real

La actualización más destacada de Claude 3.5 es su capacidad de 'Uso de Computadora': no solo conversa, sino que también interpreta lo que ve en pantalla y simula movimientos del ratón, clics y entradas de teclado. Para quienes necesitan gestionar flujos, completar formularios o realizar múltiples pasos en software, Claude 3.5 se acerca más a un asistente práctico.

¿Qué es exactamente el 'Uso de Computadora' de Claude 3.5?

El llamado Uso de Computadora de Claude 3.5 permite al modelo interactuar con aplicaciones de escritorio o interfaces web como lo haría un humano: primero identifica elementos en la pantalla, luego decide mover el cursor, hacer clic en botones o ingresar texto. No "lee directamente los datos de tu sistema", sino que ejecuta pasos basándose en las capturas de pantalla y las instrucciones que le proporciones.

Los desarrolladores también enfatizan que el Uso de Computadora de Claude 3.5 sigue en fase de prueba pública; ocasionalmente puede atascarse, hacer clics incorrectos o mostrar pasos inestables. Es más realista considerarlo como una "operación semi-automática" que acelera tareas, en lugar de esperar que funcione perfectamente de principio a fin.

¿Qué tareas se acelerarán notablemente con Claude 3.5?

Cuando una tarea requiere docenas de clics repetitivos, el valor de Claude 3.5 se vuelve más evidente: por ejemplo, ingresar información línea por línea en sistemas de backend, copiar y pegar entre páginas, descargar/organizar archivos según reglas fijas o completar campos en formularios. Siempre que los elementos de la interfaz sean relativamente claros y el flujo sea reutilizable, Claude 3.5 suele convertir el "trabajo manual" en "supervisión".

Para equipos, Claude 3.5 también es útil para validar procesos: hacer que siga un SOP (procedimiento operativo estándar) para identificar rápidamente qué pasos son propensos a errores, qué páginas tienen textos confusos o qué botones carecen de una guía clara.

Cómo usar el Uso de Computadora de Claude 3.5 (perspectiva del desarrollador)

Actualmente, la capacidad de Uso de Computadora de Claude 3.5 está orientada principalmente a desarrolladores, disponible en versión beta a través de la API, y se puede integrar en Amazon Bedrock y Google Cloud Vertex AI. El enfoque común es proporcionar a Claude 3.5 "capturas de pantalla/estado de la interfaz" junto con el "objetivo del siguiente paso", para que genere secuencias de acciones ejecutables, como clics y entradas de texto.

Se recomienda definir límites claros para Claude 3.5: qué páginas están permitidas, cómo manejar ventanas emergentes y confirmar acciones críticas dos veces. En pasos de alto riesgo, como pagos, envío de pedidos o eliminación de datos, siempre se debe mantener una confirmación manual.

En la misma actualización: Claude 3.5 Sonnet y Haiku también mejoran

Además del Uso de Computadora, Claude 3.5 Sonnet está posicionado por los desarrolladores como un "modelo más fuerte para ingeniería de software", con mejoras en codificación y uso de herramientas. Para quienes escriben código, corrigen errores o revisan repositorios diariamente, la mayor estabilidad en el seguimiento de instrucciones y razonamiento de Claude 3.5 suele ser más importante que simplemente "saber conversar".

Al mismo tiempo, Claude 3.5 Haiku se centra en ser más rápido y eficiente, ideal para escenarios de alta frecuencia orientados al usuario, como preguntas de servicio al cliente, tareas ligeras o funcionalidades que requieren baja latencia. La elección es sencilla: para tareas profundas y complejas, elige Claude 3.5 Sonnet; para velocidad y escalabilidad, opta por Claude 3.5 Haiku.

Seguridad y recordatorios de uso: no trates a Claude 3.5 como "conducción autónoma completa"

Anthropic afirma que estas actualizaciones han pasado evaluaciones de seguridad, con pruebas previas al despliegue en colaboración con instituciones de investigación en seguridad de IA en Estados Unidos y Reino Unido; y considera que su nivel de riesgo sigue siendo compatible con los estándares existentes. Aun así, la esencia del Uso de Computadora de Claude 3.5 es una "capacidad para operar interfaces": si se otorgan permisos excesivos, un pequeño error podría amplificarse y causar pérdidas reales.

El enfoque más seguro es: dar a Claude 3.5 el mínimo de permisos, restringir los sitios y aplicaciones accesibles, mantener registros de operaciones y establecer confirmaciones manuales para envíos críticos. Usado así, Claude 3.5 se asemejará más a un asistente confiable, y no a un script de automatización incontrolable.

¿Qué es exactamente el 'Uso de Computadora' de Claude 3.5?

¿Qué tareas se acelerarán notablemente con Claude 3.5?

Cómo usar el Uso de Computadora de Claude 3.5 (perspectiva del desarrollador)

En la misma actualización: Claude 3.5 Sonnet y Haiku también mejoran

Seguridad y recordatorios de uso: no trates a Claude 3.5 como "conducción autónoma completa"

Buscar artículos

Artículos Populares

Los mejores prompts para ChatGPT: usos que de verdad pueden multiplicar por 10 la eficiencia

La instalación de Claude Code siempre da error: guía paso a paso para resolver el problema de configuración en tres pasos

Lista de verificación para depurar “salidas fallidas” de ChatGPT, Claude, Gemini y Midjourney, y trucos KISS para prompts

ChatGPT: cómo sincronizar la misma cuenta entre web y app (sin perder tus chats al cambiar de dispositivo)

Guía completa de errores de reproducción en Spotify y cómo solucionarlos