GLM-5 de Z.ai en 2026 : le modèle chinois qui se fait passer pour Claude

Le 6 février 2026, un modèle anonyme baptisé « Pony Alpha » est apparu sur la plateforme OpenRouter – gratuit, sans aucune indication sur ses créateurs. La communauté IA s’est immédiatement lancée dans son identification. Ses capacités en programmation rivalisaient avec Claude Opus 4.5. À la question « qui es-tu ? », le modèle répondait : « Je suis GLM ». Mais lorsqu’on lui a demandé de créer une page web se présentant – il a écrit : « I am Claude, created by Anthropic ».

Ce comportement était reproductible à 100 %. Et c’est précisément ce détail qui définit tout ce qu’il faut savoir sur GLM-5 avant de passer aux benchmarks et aux tarifs.

Qu’est-ce que GLM-5 et qui est derrière ?

Zhipu AI – spin-off de l’Université Tsinghua, fondée en 2019, renommée Z.ai en 2025 et entrée en bourse à Hong Kong en janvier 2026. L’introduction en bourse a été remarquable : dans les trois jours suivant l’annonce officielle de GLM-5, l’action a bondi de 60 %.

GLM-5 est sorti le 11 février 2026 et prétend d’emblée au titre de modèle open source le plus performant au monde. Pour un manager, trois points essentiels :

Le modèle est gratuit et ouvert – le code est disponible sous licence MIT, n’importe quelle entreprise peut le télécharger et l’exécuter sur ses propres serveurs
Il traite jusqu’à ~400 pages de texte par requête – idéal pour les documents longs, rapports, contrats
Il a été entraîné entièrement sur des puces chinoises Huawei – sans aucun composant NVIDIA

Ce dernier point n’est pas qu’un détail technique. Dans le contexte des restrictions américaines à l’exportation, c’est une déclaration politique : la Chine est capable de créer des modèles IA compétitifs sans accès aux puces occidentales. Pour les entreprises, cela signifie que le fournisseur n’est pas soumis aux sanctions occidentales – contrairement à OpenAI ou Anthropic.

L’affaire Pony Alpha : une enquête sans conclusion

« Pony » fait référence à l’année du Cheval dans le calendrier chinois. Le 11 février, Zhipu a officiellement confirmé que Pony Alpha était GLM-5. L’action de l’entreprise a bondi de 60 % en trois jours.

Évolution du cours de l’action depuis le lancement

La question de ce qui s’est réellement passé n’a jamais reçu de réponse officielle. Zhipu n’a pas commenté la confusion d’identité.

Ce n’est pas un cas isolé. En décembre 2025, des chercheurs du MIT ont constaté que dans environ 50 % des cas, les modèles de la série GLM s’identifiaient comme Claude lorsqu’on utilisait des méthodes de requête non standard. DeepSeek V3 présentait une particularité similaire – sous certains prompts, il se présentait comme ChatGPT ou GPT-4. OpenAI a directement accusé DeepSeek de distillation à partir de ses modèles et a mis à jour ses conditions d’utilisation. Anthropic, Mistral et xAI ont suivi avec des clauses anti-distillation similaires.

La distillation – entraîner un modèle plus petit sur les résultats d’un modèle plus grand – est, de toute évidence, un secret de Polichinelle dans l’industrie. Confirmer son utilisation dans GLM-5 est impossible : nous ne disposons d’aucun audit technique. L’infirmer aussi : les schémas de comportement sont trop spécifiques.

Cela soulève une question : si le modèle « se faisait passer » pour Claude lors de requêtes détournées – qu’a-t-il exactement assimilé durant son entraînement ? Et dans quelle mesure cela importe-t-il pour un manager qui cherche un outil opérationnel ?

Ce que montrent les tests

Sur les benchmarks industriels standard, GLM-5 rivalise avec les meilleurs modèles propriétaires – et pour un modèle gratuit et open source, c’est loin d’être anodin. Voici ce qui compte pour un manager :

Programmation – résout 77,8 % des tâches réelles issues de GitHub. À titre de comparaison : Claude Opus 4.5 – 80,9 %, GPT-5.2 – 75,4 %. L’écart avec les leaders est minimal.

Simulation d’entreprise (Vending Bench 2 – un test où le modèle « gère une entreprise » pendant un an) – GLM-5 a terminé avec un solde de 4 432 $, Claude Opus 4.5 – 4 967 $. Le modèle prend des décisions stratégiques à un niveau comparable aux meilleurs concurrents occidentaux.

Recherche web – première place parmi tous les modèles testés, y compris GPT-5.2 et Claude.

Hallucinations – meilleur résultat de l’industrie. GLM-5 préfère dire « je ne sais pas » plutôt qu’inventer une réponse. Pour le travail avec des faits et des chiffres, c’est crucial.

Comme toujours, les tests et l’utilisation réelle sont deux choses différentes. Mais la tendance est claire : GLM-5 joue dans la même ligue que ChatGPT et Claude.

Comment GLM-5 s’est comporté dans nos tests

Dans le cadre de notre comparatif, nous avons testé GLM-5 sur des tâches managériales réelles réparties en 8 catégories.

Résultat global : 7e place parmi tous les modèles testés – un milieu de tableau solide. Mais le diable est dans les détails.

Là où GLM-5 a surpris :

Gestion d’équipe – 1re place parmi tous les modèles. Un résultat inattendu : GLM-5 s’est montré le plus performant pour l’évaluation des collaborateurs, la conception de systèmes de motivation, le feedback et la résolution de conflits
Formation et développement – 4e place
Communication professionnelle – 7e place

Là où il a échoué :

Normes professionnelles françaises et européennes – le modèle a obtenu des scores nettement inférieurs sur les tâches nécessitant une connaissance des pratiques commerciales françaises et européennes
Recherche et analyse d’information – 13e place
Résolution de problèmes – 15e place

Pour un manager, la conclusion est pragmatique : GLM-5 est l’un des meilleurs outils pour les tâches liées aux personnes. Si vous rédigez une évaluation de performance, concevez un système de KPI ou préparez un entretien avec un collaborateur – ce modèle mérite votre attention. Si vous avez besoin de comprendre des spécificités commerciales locales ou de trouver des informations actualisées – le résultat sera moins convaincant.

Interface de réflexion amusante, qui suggère qu’il a été conçu d’abord pour les développeurs

Comment utiliser GLM-5 dès maintenant

chat.z.ai – l’interface web officielle, accessible mondialement. Connexion via un compte Google. L’interface est en anglais et en chinois – pas de version française – mais le modèle comprend le français et peut répondre en français.

Deux modes de fonctionnement :

Chat Mode – le format de dialogue classique. Convient à la plupart des tâches : rédaction de textes, analyse de documents, réponses aux questions.

Agent Mode – c’est ici que GLM-5 révèle tout son potentiel. Le modèle peut utiliser des outils : générer des fichiers .docx, .pdf, .xlsx, effectuer des recherches web, exécuter des tâches en plusieurs étapes. Si vous demandez un rapport avec des tableaux – c’est le mode qu’il vous faut.

Recommandation pratique concernant la langue : la qualité des réponses en anglais est sensiblement supérieure à celle en français. Le français est partiellement supporté par GLM-5 – le modèle peut répondre en français, mais la qualité est inconstante. Attendez-vous à des erreurs grammaticales, des tournures maladroites et des anglicismes occasionnels. Pour une analyse complexe, utilisez des prompts en anglais. Le support du français est meilleur que celui de l’estonien mais nettement en retrait par rapport à l’anglais. À titre de comparaison : Claude et ChatGPT gèrent le français de manière bien plus naturelle. C’est la même situation qu’avec Qwen : les modèles chinois fonctionnent mieux dans les langues sur lesquelles ils ont été le plus entraînés.

La semaine suivant le lancement de GLM-5 a été mouvementée : le trafic a été multiplié par 10, le service a connu des instabilités pendant plusieurs jours, et Zhipu a présenté des excuses publiques. À la mi-mars, la situation s’est normalisée, mais il faut garder à l’esprit que c’est un service jeune avec une charge en croissance rapide.

Limites et risques

La censure chinoise fonctionne de manière prévisible : les sujets politiquement sensibles, la critique historique de l’État, certains événements – tout cela est bloqué. Pour un manager, c’est rarement un problème en pratique, mais il est utile de le savoir.

Qualité en français – l’une des faiblesses majeures. La qualité est inconstante : le modèle répond en français mais avec des problèmes de grammaire notables et des formulations peu naturelles. Pour un usage professionnel, les prompts en anglais sont recommandés. Contrairement à DeepSeek, qui gère mieux les langues européennes dans des contextes d’affaires, GLM-5 perd sensiblement en précision et en nuance sur des tâches en français. Nos tests l’ont confirmé.

Vitesse de réponse en mode d’analyse approfondie nettement inférieure à Claude et GPT – environ 30 à 40 % plus lente. Pas critique pour des tâches ponctuelles, mais perceptible lors d’un travail intensif.

La question de la distillation reste ouverte. Cela ne signifie pas que le modèle est techniquement peu fiable – il fonctionne. Mais pour les organisations qui utilisent Claude et se soucient de l’éthique de l’utilisation de l’IA, ce fait mérite d’être pris en compte.

Déploiement sur ses propres serveurs – techniquement possible (le code est ouvert), mais nécessite du matériel serveur dont le coût se chiffre en dizaines de milliers d’euros. Contrairement aux modèles compacts de Qwen, GLM-5 ne peut pas être déployé par un simple département informatique.

Pas d’application mobile – uniquement le web.

Tarifs

Option	Coût	Pour qui
chat.z.ai	Gratuit (avec limites)	Essayer sans engagement
API via OpenRouter	~0,15 $ pour l’analyse d’un rapport de 100 pages	Intégration dans les processus de travail

À titre de comparaison : la même analyse via Claude Opus 4.5 coûterait environ 3 $, via GPT-5.2 – environ 1,50 $. GLM-5 est 20 fois moins cher pour des capacités comparables sur de nombreuses tâches.

Cela dit, parmi les modèles chinois open source, GLM-5 est le plus cher. DeepSeek et Qwen coûtent encore 3 à 5 fois moins. Pourquoi payer plus ? Pour les meilleurs résultats en gestion d’équipe et en recherche web – si ce sont vos priorités, la différence se justifie.

Un détail important : après le lancement de GLM-5, Zhipu a augmenté les prix du plan Pro d’environ 30 %, ce qui a provoqué le mécontentement des utilisateurs.

Faut-il l’essayer ?

GLM-5 est un modèle avec des forces réelles et des faiblesses réelles, enveloppé dans une histoire qui n’a toujours pas reçu de réponse définitive.

Le résultat impressionnant en gestion d’équipe – première place parmi tous les modèles que nous avons testés – est réel et reproductible. Si vous travaillez régulièrement sur des tâches liées aux RH et au management : évaluations de performance, conception de systèmes de motivation, feedback, résolution de conflits – GLM-5 mérite d’être essayé.

Si vous avez besoin d’un modèle pour travailler dans un contexte francophone, rechercher des informations actualisées ou traiter des tâches avec une forte spécificité locale – GLM-5 est en retrait face à la concurrence. Pour ces besoins, DeepSeek ou Claude feront mieux le travail.

L’affaire Pony Alpha et l’identification comme Claude ne sont pas une raison de rejeter l’outil, mais une raison de garder une distance analytique. L’industrie évolue depuis longtemps dans une zone grise où la frontière entre « inspiration » et « distillation » est volontairement floue. Ce n’est pas une exception pour GLM-5 – c’est le tableau d’ensemble qu’il est honnête de garder en tête.

L’accès est simple : chat.z.ai est accessible mondialement, connexion via Google, un niveau gratuit existe. Cela vaut la peine de consacrer une heure aux tests – et de se forger sa propre opinion.

Bientôt disponible

Analysez GLM-5 et d'autres outils IA en pratique

9 leçons diagnostiques : essayez GLM-5 et d'autres modèles sur des tâches réelles – et découvrez quelles erreurs commettent la plupart des managers. Sans inscription.

Analyse approfondie des outils avec des exemples

Prompts prêts à l'emploi pour les tâches courantes

Compétences pour une utilisation sûre de l'IA

Comment mesurer le ROI de l'IA

Ouvrir le module gratuit →

Aucun paiement requis

GLM-5 de Z.ai en 2026 : le modèle chinois qui se fait passer pour Claude

Qu’est-ce que GLM-5 et qui est derrière ?

L’affaire Pony Alpha : une enquête sans conclusion

Ce que montrent les tests

Comment GLM-5 s’est comporté dans nos tests

Comment utiliser GLM-5 dès maintenant

Limites et risques

Tarifs

Faut-il l’essayer ?

Analysez GLM-5 et d'autres outils IA en pratique

Essentiels

Analytiques

Fonctionnels

Marketing

Qu’est-ce que GLM-5 et qui est derrière ?

L’affaire Pony Alpha : une enquête sans conclusion

Ce que montrent les tests

Comment GLM-5 s’est comporté dans nos tests

Comment utiliser GLM-5 dès maintenant

Limites et risques

Tarifs

Faut-il l’essayer ?

Analysez GLM-5 et d'autres outils IA en pratique

Autres parties de cette série

DeepSeek en 2026 : revue du modèle IA économique de référence

Comment évaluer la qualité des LLM en 2026 : guide des benchmarks pour managers

🍪 Nous utilisons des cookies

⚙️ Paramètres des cookies

Essentiels

Analytiques

Fonctionnels

Marketing

Attention

Politique de cookies