GLM-5 de Z.ai en 2026: el modelo chino que finge ser Claude

El 6 de febrero de 2026, en la plataforma OpenRouter apareció un modelo anónimo llamado «Pony Alpha» – gratuito, sin ningún detalle sobre sus creadores. La comunidad de IA comenzó a identificarlo de inmediato. Sus capacidades de programación se acercaban a las de Claude Opus 4.5. Al preguntarle «¿quién eres?», el modelo respondía: «Soy GLM». Pero cuando le pidieron crear una página web describiéndose a sí mismo, escribió: «I am Claude, created by Anthropic».
Esto era reproducible al cien por ciento. Y precisamente este momento define todo lo que necesitas saber sobre GLM-5 antes de pasar a los benchmarks y las tarifas.
Qué es GLM-5 y quién está detrás
Zhipu AI – un spin-off de la Universidad de Tsinghua, fundado en 2019, que en 2025 cambió su nombre a Z.ai y salió a la Bolsa de Hong Kong en enero de 2026. La salida a bolsa fue impresionante: en los tres días posteriores al anuncio oficial de GLM-5, las acciones subieron un 60%.

GLM-5 se lanzó el 11 de febrero de 2026 y aspira directamente al título del modelo abierto más potente del mundo. Para un manager, hay tres cosas importantes:
- El modelo es gratuito y abierto – el código está disponible bajo licencia MIT, cualquier empresa puede descargarlo y ejecutarlo en sus propios servidores
- Con una sola consulta «lee» hasta ~400 páginas de texto – ideal para trabajar con documentos extensos, informes, contratos
- Fue entrenado completamente con chips chinos de Huawei – sin un solo componente de NVIDIA
Este último punto no es un simple detalle técnico. En el contexto de las restricciones de exportación estadounidenses, es una declaración política: China puede crear modelos de IA competitivos sin acceso a chips occidentales. Para el negocio, esto significa que el proveedor no depende de sanciones occidentales – a diferencia de OpenAI o Anthropic.
La historia de Pony Alpha: un misterio sin resolver
«Pony» – una referencia al año del Caballo en el calendario chino. El 11 de febrero, Zhipu confirmó oficialmente: Pony Alpha es GLM-5. Las acciones de la empresa subieron un 60% en tres días.

La pregunta sobre qué ocurrió exactamente nunca recibió una respuesta oficial. Zhipu no comentó la confusión de identidad.
No es un caso aislado. En diciembre de 2025, investigadores del MIT documentaron que en aproximadamente el 50% de los casos, los modelos de la serie GLM se identifican como Claude cuando se emplean métodos no convencionales de consulta. DeepSeek V3 tenía una peculiaridad similar – con ciertos prompts se presentaba como ChatGPT o GPT-4. OpenAI respondió acusando directamente a DeepSeek de destilar sus modelos y actualizó sus términos de uso. Anthropic, Mistral y xAI siguieron con cláusulas similares contra la destilación.
La destilación – entrenar un modelo más pequeño con las salidas de uno más grande – es, aparentemente, un secreto a voces de la industria. Confirmar su uso en GLM-5 es imposible: no tenemos una auditoría técnica. Negarlo también: los patrones de comportamiento son demasiado específicos.
Esto lleva a una reflexión: si el modelo «fingía» ser Claude con métodos indirectos de consulta – ¿qué exactamente estaba asimilando durante su entrenamiento? ¿Y cuánto importa esto para un manager que necesita una herramienta funcional?
Qué muestran los tests
En los benchmarks estándar de la industria, GLM-5 compite con los mejores modelos cerrados – y esto, para un modelo abierto y gratuito, no es trivial. Lo que importa para un manager:
Programación – resuelve el 77,8% de las tareas reales de GitHub. Para comparar: Claude Opus 4.5 – 80,9%, GPT-5.2 – 75,4%. La brecha con los líderes es mínima.

Simulación empresarial (Vending Bench 2 – un test donde el modelo «gestiona un negocio» durante un año) – GLM-5 terminó con un balance de $4 432, Claude Opus 4.5 – $4 967. El modelo toma decisiones estratégicas aproximadamente al nivel de los mejores competidores occidentales.
Búsqueda de información en la web – primer lugar entre todos los modelos evaluados, incluyendo GPT-5.2 y Claude.
Alucinaciones – el mejor resultado de la industria. GLM-5 prefiere decir «no lo sé» antes que inventar una respuesta. Para trabajar con datos y cifras, esto es crítico.

Como siempre, los tests y el uso real son cosas distintas. Pero la dirección está clara: GLM-5 juega en la misma liga que ChatGPT y Claude.
Cómo rindió GLM-5 en nuestras pruebas
Dentro de nuestra comparación, evaluamos GLM-5 en tareas reales de gestión en 8 categorías.
Resultado general: 7.º lugar entre todos los modelos evaluados – un sólido término medio. Pero el diablo está en los detalles.
Donde GLM-5 sorprendió:
- Gestión de equipos – 1.er lugar entre todos los modelos. Un resultado inesperado: GLM-5 superó a los demás en evaluación de empleados, diseño de sistemas de motivación, feedback y resolución de conflictos
- Formación y desarrollo – 4.º lugar
- Comunicación profesional – 7.º lugar
Donde falló:
- Contexto latinoamericano y español de negocios – 15.º lugar. Las prácticas empresariales locales, normativas regionales y matices culturales del mundo hispanohablante – aquí GLM-5 queda notablemente rezagado
- Búsqueda y análisis de información – 13.er lugar
- Resolución de problemas – 15.º lugar
Para un manager, la conclusión es pragmática: GLM-5 es una de las mejores herramientas para tareas relacionadas con personas. Si estás redactando un performance review, diseñando un sistema de KPIs o preparándote para una conversación difícil con un colaborador – este modelo merece tu atención. Si necesitas entender la realidad empresarial de tu mercado local o encontrar información actualizada – el resultado será peor.

Cómo usar GLM-5 ahora mismo
chat.z.ai – la interfaz web oficial, accesible globalmente, sin necesidad de VPN. Inicio de sesión con cuenta de Google. La interfaz está en inglés y chino; no hay UI en español, pero el modelo entiende español y responde en él.
Dos modos de trabajo:
Chat Mode – el formato de diálogo habitual. Sirve para la mayoría de tareas: redacción de textos, análisis de documentos, respuestas a preguntas.
Agent Mode – aquí GLM-5 se despliega por completo. El modelo puede usar herramientas: generar archivos en formato .docx, .pdf, .xlsx, realizar búsquedas web, ejecutar tareas de múltiples pasos. Si necesitas preparar un informe con tablas – este es el modo indicado.
Recomendación práctica sobre el idioma: el español no es un idioma fuerte para GLM-5. El modelo entiende español, pero las respuestas son notablemente más débiles que en inglés o chino – espera errores gramaticales, expresiones poco naturales y desajustes culturales. Para tareas complejas, formula los prompts en inglés y luego traduce los resultados. En comparación, DeepSeek maneja el español algo mejor, aunque tampoco es su punto fuerte. Es la misma situación que con Qwen: los modelos chinos funcionan mejor en los idiomas con los que fueron entrenados más intensamente.
La semana posterior al lanzamiento de GLM-5 fue turbulenta: el tráfico se multiplicó por 10, el servicio funcionó de forma inestable durante varios días, y Zhipu publicó una disculpa oficial. A mediados de marzo la situación se normalizó, pero conviene tenerlo en cuenta: es un servicio joven con una carga en rápido crecimiento.
Limitaciones y riesgos
La censura china funciona de forma predecible: temas políticamente sensibles, críticas históricas al Estado, ciertos eventos – todo esto queda bloqueado. Para un manager, esto rara vez supone un problema en la práctica, pero conviene saberlo.
Calidad en español – una de las debilidades clave. Las respuestas en español son notablemente menos precisas que en inglés. Para tareas empresariales serias, usa prompts en inglés. A diferencia de DeepSeek, que maneja algo mejor el contexto hispanohablante, GLM-5 pierde precisión y matices de forma evidente en tareas en español. Nuestras pruebas lo confirmaron.

Velocidad de respuesta en el modo de análisis profundo es notablemente inferior a Claude y GPT – aproximadamente un 30–40% más lenta. No es crítico para tareas puntuales, pero se nota en sesiones de trabajo intensivas.
La cuestión de la destilación sigue abierta. Esto no significa que el modelo sea técnicamente poco fiable – funciona. Pero para organizaciones que usan Claude y reflexionan sobre la ética del uso de IA, este dato merece consideración.
Ejecución en servidores propios – técnicamente posible (el código es abierto), pero requiere equipamiento de servidor con un coste de varias decenas de miles de dólares como mínimo. A diferencia de los modelos compactos de Qwen, GLM-5 no se puede desplegar con los recursos de un departamento de TI estándar.
No hay aplicación móvil – solo web.
Precios
| Opción | Coste | Para quién |
|---|---|---|
| chat.z.ai | Gratis (con límites) | Probar sin compromiso |
| API a través de OpenRouter | ~$0,15 por análisis de un informe de 100 páginas | Integración en flujos de trabajo |
Para comparar: el mismo análisis a través de Claude Opus 4.5 costaría aproximadamente $3, a través de GPT-5.2 – alrededor de $1,50. GLM-5 es 20 veces más barato con capacidades comparables en muchas tareas.
Dicho esto, entre los modelos abiertos chinos, GLM-5 es el más caro. DeepSeek y Qwen cuestan entre 3 y 5 veces menos. ¿Por qué pagar más? Por el mejor resultado en gestión de equipos y búsqueda de información en la web – si esas son tus prioridades, la diferencia está justificada.
Un matiz importante: tras el lanzamiento de GLM-5, Zhipu subió los precios del plan Pro aproximadamente un 30%, lo que generó malestar entre los usuarios.
¿Merece la pena probarlo?
GLM-5 es un modelo con fortalezas honestas y debilidades honestas, envuelto en una historia que todavía no tiene respuesta definitiva.
El resultado impresionante en gestión de equipos – primer lugar entre todos los modelos que evaluamos – es real y reproducible. Si trabajas regularmente con tareas de HR y gestión de personas: performance reviews, diseño de sistemas de motivación, feedback, resolución de conflictos – GLM-5 merece que lo pruebes.
Si necesitas un modelo que entienda el contexto empresarial latinoamericano o español, que busque información actualizada o que maneje tareas con marcada especificidad regional – aquí GLM-5 queda por detrás de sus competidores. Para esas necesidades, DeepSeek o Claude funcionarán mejor.
La historia de Pony Alpha y la identificación como Claude no es razón para descartar la herramienta, pero sí para mantener distancia analítica. La industria lleva tiempo operando en una zona gris donde la frontera entre «inspiración» y «destilación» se difumina intencionalmente. Esto no es una excepción de GLM-5 – es el panorama general, que vale la pena tener presente.
La facilidad de acceso no deja dudas: chat.z.ai funciona a nivel global, sin VPN, con inicio de sesión vía Google y un nivel gratuito disponible. Merece la pena dedicar una hora a probarlo – y formar tu propia opinión. Eso sí, para tareas serias en español, prepárate para trabajar con prompts en inglés.
Analizamos GLM-5 y otras herramientas de IA en la práctica
9 lecciones de diagnóstico: prueba GLM-5 y otros modelos en tareas reales – y descubre qué errores cometen la mayoría de los managers. Sin registro.

