El sector de ciberseguridad en Wall Street retrocedió de forma generalizada el viernes: CrowdStrike llegó a caer cerca de un 7% intradía y Palo Alto Networks bajó alrededor de un 6%. La volatilidad del mercado se vinculó a un rumor sobre una “filtración de capacidades de un modelo de IA”: según informes, información de un nuevo modelo aún no publicado de Anthropic se filtró antes de tiempo al haberse almacenado en una caché de datos accesible públicamente; el contenido fue dado a conocer inicialmente por medios extranjeros.
El borrador de una entrada de blog filtrada mencionaba el nombre en clave del nuevo modelo, “Claude Mythos”, e introducía una nueva categoría de nivel de modelos llamada “Capybara”, señalando que su escala y capacidades podrían superar al actual Opus de gama alta. El borrador también advertía que el modelo estaría “a la cabeza” en capacidades de ciberseguridad, lo que podría conllevar el riesgo de explotar vulnerabilidades a mayor velocidad y por encima de la capacidad de respuesta de los defensores. Un portavoz de Anthropic afirmó que la compañía está desarrollando un modelo de propósito general con avances significativos en razonamiento, programación y ciberseguridad, y que avanzará con cautela en su lanzamiento.

