Qwen d'Alibaba en 2026 : d'un leader open source aux flagships fermés

Pendant que les managers paient pour ChatGPT Plus et Claude Pro, Alibaba a bâti l’un des écosystèmes d’IA les plus vastes au monde – avec un chat gratuit, des modèles ouverts et des prix d’API plusieurs fois inférieurs à ceux de la concurrence. Qwen (se prononce « Tchouen », de 通义千问 – « Mille Questions ») a, au milieu de 2026, dépassé en nombre de téléchargements tous ses équivalents occidentaux et s’est imposé comme un outil que tout manager devrait connaître. Mais en six mois, l’écosystème a profondément changé : les modèles phares sont devenus fermés, des développeurs clés sont partis, et la stratégie a basculé du « tout gratuit » vers le modèle classique « le meilleur est payant ».

L’atout principal de Qwen pour un manager est simple : c’est un assistant IA complet, accessible gratuitement via Qwen Chat – sans abonnement, sans limite de requêtes. En avril 2026, le nombre de téléchargements des modèles Qwen approchait le milliard – la famille représente plus de 50 % de tous les téléchargements de modèles ouverts dans le monde. L’application grand public de Qwen compte 203 millions d’utilisateurs actifs mensuels, troisième position mondiale après ChatGPT et DouBao.

Fenêtre principale du chat Qwen

Qu’est-ce qui différencie Qwen ?

Le principal différenciateur de Qwen par rapport à la plupart des concurrents, c’est l’échelle et la flexibilité. Alibaba publie une part importante de ses modèles en accès ouvert sur Hugging Face – n’importe quelle entreprise peut les télécharger et les déployer sur ses propres serveurs. Parmi ceux qui ont utilisé Qwen comme base : Oylan, le modèle de langage national du Kazakhstan. Les modèles phares de la série 3.7 (Max et Plus), en revanche, ne sont accessibles que via API – Alibaba suit de plus en plus le modèle d’OpenAI et Anthropic.

La plupart des modèles Qwen sont disponibles en téléchargement pour un déploiement sur serveur propre – mais pas tous : la série 3.7 est fermée. Pour les entreprises ayant des exigences strictes en matière de sécurité des données, les modèles ouverts (Qwen3.6-Plus, Qwen 4 Coder) restent parmi les meilleurs au monde.
Les modèles phares fonctionnent selon un principe de spécialisation : chaque requête ne mobilise que le « segment de connaissance » pertinent, sans activer le modèle dans son intégralité. Résultat pratique : un modèle de la taille d’un ordinateur portable offre une qualité de réponse qui exigeait auparavant du matériel serveur coûtant plusieurs centaines de milliers d’euros.
Les modèles texte de la série Qwen3 supportent 119 langues et dialectes ; les versions les plus récentes en supportent 201, y compris le russe. La Russie est l’un des plus gros marchés de Qwen : environ 30 % du trafic de la plateforme provient d’utilisateurs russophones.
Texte, images, vidéo, audio, synthèse vocale – tout dans un seul écosystème.

Ce que Qwen sait faire en juillet 2026

La gamme Qwen couvre aujourd’hui pratiquement tous les types de tâches auxquelles une entreprise moderne est confrontée :

Agents nouvelle génération. Qwen 3.7 Max (mai 2026) est conçu comme un « modèle agentique » – capable d’exécuter en autonomie des chaînes de 1 000+ appels d’outils en une seule session sans dégradation de qualité. Contexte de 1 million de tokens, taux d’hallucination le plus bas parmi les modèles de pointe (22,9 %).
Agent multimodal. Qwen 3.7 Plus (disponibilité générale au 1er juin 2026) comprend le texte, les images et la vidéo, « voit » l’écran et renvoie les coordonnées des éléments d’interface (GUI agent grounding). Contexte de 1 million de tokens, prix de 0,40 $/1,60 $ par million de tokens – 6 fois moins cher que Qwen 3.7 Max.
Un niveau de code inédit. Qwen 4 Coder 32B-A3B (2 juin 2026) est le premier modèle ouvert à franchir 82 % sur SWE-Verified. Architecture MoE : 32 milliards de paramètres, dont seulement 3 milliards actifs – tourne sur un Mac avec 24 Go de mémoire à 58 tokens/s. Licence Apache 2.0.
Travail sur documents longs. Qwen3.6-Plus garde en mémoire jusqu’à 1 million de tokens – environ 2 000 pages A4 par requête. Vous pouvez charger un rapport annuel complet, une base de tickets clients ou tout un dépôt de code et interroger l’ensemble.
Raisonnement complexe. Qwen3.7-Max en mode chaîne de raisonnement atteint 92,4 % sur GPQA Diamond – au-dessus de Claude Opus 4.6 Max (91,3 %) et de K2.6 Thinking (90,5 %). Sur les problèmes mathématiques (Apex Math) : 44,5 % contre 34,5 % pour Claude Opus 4.6 Max.
Programmation agentique. Qwen3.6-35B-A3B fonctionne avec Claude Code, Qwen Code et des outils similaires, et résout des tâches au niveau de Claude Sonnet 4.5 à un coût plusieurs fois inférieur. Licence ouverte – déployable au sein de l’entreprise.
Voix et vidéo dans un seul modèle. Qwen3.5-Omni comprend simultanément texte, images, audio et vidéo au sein d’une architecture unique. Il alimente l’« Audio-Visual Vibe Coding » – un mode où la tâche est décrite à la voix et via une vidéo de l’écran, et où le modèle génère le code.
Génération d’images et de voix. Qwen-Image-2512 produit des images photoréalistes avec un rendu précis du texte multiligne – une rareté parmi les modèles génératifs. Qwen3-TTS synthétise la parole avec clonage vocal pour la narration et les assistants vocaux.
En tête des modèles ouverts. Qwen3.5-Max-Preview figure dans le top 5 de LM Arena avec un score de 1464 – première place parmi les modèles chinois et sixième mondiale. Qwen3.5-397B-A17B est le troisième meilleur modèle open source au monde, comparable à GPT-5 et Claude Opus.

Qwen Audio-Visual Vibe Coding

Principaux modèles Qwen (juillet 2026)

D’ici la mi-2026, Alibaba a constitué l’une des gammes de modèles les plus étendues du secteur.

Modèles disponibles dans Qwen

Qwen 3.7 Max – Flagship agentique (mai 2026)

Qwen 3.7 Max Entre dans les détails балл 7.8 #20 из 47 $0.037 за задачу доступен из РФ

протестировано: May 2026 · бенчмарк mysummit.school О модели → Сравнить →

Qwen 3.7 Max (noté sans espace : Qwen3.7-Max) a été annoncé lors de l’Alibaba Cloud Summit le 20 mai 2026, après une apparition discrète sur LM Arena le 14 mai. La série 3.7 comprend deux modèles : Qwen3.7-Max (flagship texte pour le raisonnement et les tâches agentiques) et Qwen3.7-Plus (agent multimodal, disponibilité générale depuis le 1er juin 2026).

Caractéristiques clés de Qwen3.7-Max :

Contexte de 1 million de tokens – le double de Qwen 3.6 Max (256K)
Architecture agentique – le modèle peut réaliser des sessions autonomes de jusqu’à 35 heures, en enchaînant plus de 1 000 appels d’outils successifs sans perte de qualité. Lors de la démonstration au sommet, le modèle a optimisé en autonomie un noyau via plus de 1 000 modifications de code, obtenant une accélération d’inférence par 10
Taux d’hallucination le plus bas parmi les modèles de pointe – 22,9 %
Mode « Thinking » – une chaîne de raisonnement activable, visible dans l’interface de Qwen Chat

Résultats aux benchmarks :

Benchmark	Qwen3.7-Max	Comparaison
Intelligence Index v4.0	56,6	5e place mondiale, 1re parmi les modèles chinois
GPQA Diamond	92,4 %	Au-dessus de Claude Opus 4.6 Max (91,3 %)
Apex Math	44,5 %	Au-dessus de Claude Opus 4.6 Max (34,5 %)
MRCR-v2 128K (contexte long)	90,4 %	Au-dessus de Qwen3.6-Plus (85,9 %)
Terminal-Bench Hard (code)	50,8 %	–

Important : Qwen3.7 n’est disponible que via API – il n’existe pas de poids ouverts. Alibaba a par le passé publié des versions ouvertes après une phase de preview fermée (c’était le cas pour Qwen 3.6), mais pour la série 3.7, aucun calendrier n’a été annoncé. Cela s’inscrit dans une tendance plus large : les modèles phares deviennent fermés.

Qwen 3.7 Plus – Agent multimodal (disponibilité générale – 1er juin 2026)

Qwen 3.7 Plus Comprend les tâches simples балл 7.5 #27 из 47 $0.006 за задачу доступен из РФ

протестировано: July 2026 · бенчмарк mysummit.school О модели → Сравнить →

Qwen3.7-Plus est apparu sur LM Arena le 14 mai en preview et a atteint la disponibilité générale (GA) le 1er juin 2026. C’est la version multimodale de la série 3.7 : le modèle accepte en entrée du texte, des images et de la vidéo, et renvoie du texte.

Différence clé par rapport à Qwen3.7-Max :

GUI Agent Grounding – le modèle « voit » une capture d’écran et renvoie les coordonnées pixel précises des éléments d’interface. Cela permet de construire des agents autonomes qui pilotent des applications visuellement – sans API
Contexte de 1 million de tokens, jusqu’à 65 536 tokens en sortie, budget de raisonnement interne jusqu’à 256K tokens
Paramètre preserve_thinking – conserve l’état du raisonnement entre les appels d’outils dans une boucle agentique
Prix : 0,40 $ / 1,60 $ par million de tokens (entrée/sortie) – 6 fois moins cher que Qwen 3.7 Max

Qwen 3.7 Plus est un modèle fermé (API uniquement, sans poids ouverts). Pour un manager, c’est un signal important : les modèles multimodaux Qwen les plus performants ne sont désormais accessibles que via API cloud, et non plus pour un déploiement local.

Qwen3.6-Plus – Flagship à contexte de 1 million de tokens

Qwen 3.6 Plus Entre dans les détails балл 7.9 #18 из 47 $0.011 за задачу доступен из РФ

протестировано: May 2026 · бенчмарк mysummit.school О модели → Сравнить →

Lancé en avril 2026 en réponse à Gemini 2.5 et GPT-5. Son architecture hybride combine attention linéaire et mélange parcimonieux d’experts – ce qui permet de traiter des documents gigantesques sans perte de vitesse.

Contexte jusqu’à 1 million de tokens – environ 2 000 pages A4 par requête. Vous pouvez charger un dépôt de code entier, un rapport annuel ou une base de tickets clients.
78,8 % sur SWE-bench Verified – presque au niveau des flagships fermés sur les tâches de programmation.
Audio-Visual Vibe Coding : décrivez la tâche à la voix et montrez la maquette à la caméra – le modèle génère le code.
Licence Apache 2.0 – les poids peuvent être téléchargés et exécutés localement.

Qwen3.5 – Famille de modèles multimodaux

Lancé en mars 2026, disponible sur Microsoft Azure. La différence clé : ces modèles « comprennent » texte, images, audio et vidéo comme un tout unifié au sein d’une seule architecture. Un seul prompt peut référencer simultanément un document chargé, une capture d’écran, un extrait vidéo et du contexte textuel.

La série couvre une plage sans précédent – de 0,8 milliard de paramètres (exécutable sur smartphone) à 397 milliards (comparable à GPT et Claude) :

Qwen3.5-4B / 9B – les plus « intelligents » de leur catégorie ; tournent sur un ordinateur portable et surpassent des modèles 2 à 3 fois plus grands. Même sur un téléphone.
Qwen3.5-27B – suivi strict des instructions : rapports structurés, formulaires, tâches multi-étapes.
Qwen3.5-35B-A3B – équilibre entre qualité et vitesse : 35 milliards de paramètres, seulement 3 milliards actifs.
Qwen3.5-122B-A10B – analyses complexes et grands volumes d’information.
Qwen3.5-397B-A17B – modèle phare open source ; sur le benchmark GDPval-AA, dépasse son prédécesseur Qwen3-235B de 361 points. Troisième meilleur modèle open source au monde.

Commun à toute la série :

Environ 400 pages A4 par requête ; le contexte peut être étendu à l’équivalent d’un petit livre.
Deux modes — « Réfléchir » (raisonnement étape par étape pour les tâches complexes) et « Ne pas réfléchir » (réponses instantanées pour la routine) — commutables au sein d’un même modèle sans changer de service.
Support de 201 langues, y compris le russe.
Rivalise avec les principaux modèles multimodaux sur des benchmarks indépendants à un coût nettement inférieur.

Le changement de mode est l’une des innovations clés de Qwen3/3.5. Pas besoin de choisir entre un modèle « intelligent » et un modèle « rapide » : le même modèle s’adapte à la complexité de la tâche. Mode analyse approfondie pour un rapport financier. Réponse instantanée pour « quand est la réunion ? »

Qwen3-235B – Modèle texte phare open source

Lancé en avril 2025, entraîné sur deux fois plus de données que la génération précédente. L’architecture spécialisée atteint une qualité de haut niveau avec des coûts de calcul nettement inférieurs — perceptible lors du travail via API.

Le code du modèle est ouvert — toute entreprise peut le télécharger et l’exécuter sur ses propres serveurs. Un matériel serveur conséquent est requis.
Le modèle « réfléchit » avant de répondre — en vérifiant la logique étape par étape. Important pour les calculs complexes, l’analyse juridique, la planification financière.
Qwen3-Max — version cloud via API pour ceux qui préfèrent ne pas gérer leur propre installation.
Jusqu’à 200 pages A4 par requête ; jusqu’à 400 pages en mode étendu.

Qwen3-30B – Option optimale pour serveur d’entreprise

Un modèle de classe entreprise : traite les requêtes rapidement et économiquement malgré sa grande taille. Surpasse les anciens modèles qui nécessitaient trois fois plus de ressources.

Pour les équipes ayant besoin d’un assistant puissant sur leurs propres serveurs sans coûts de centre de données.
Jusqu’à 200 pages A4 par requête.

Qwen3-Coder-Next – Modèle pour développeurs (février 2026)

Modèle spécialisé pour l’écriture et la révision de code. Surpasse les modèles DeepSeek sur des benchmarks indépendants, avec des résultats comparables à Claude Sonnet 4.5.

Pour les managers, c’est probablement un outil pour l’équipe de développement plutôt qu’une utilisation directe : le modèle peut maintenir en mémoire l’intégralité d’un projet — pas un seul fichier, mais tout le dépôt. Le déploiement local nécessite environ 51 Go de RAM.

Qwen 4 Coder – Premier codeur open source à 82 % sur SWE-Verified (juin 2026)

Qwen 4 Coder 32B-A3B, sorti le 2 juin 2026, est le premier modèle à marquer la transition vers la quatrième génération de Qwen, et le premier modèle ouvert à franchir 80 % sur SWE-Verified – un benchmark qui corrèle avec la productivité réelle d’un développeur.

Architecture MoE : 32 milliards de paramètres au total, 3 milliards actifs par token. Contexte de 256K
82 % SWE-Verified – au-dessus de Devstral, Qwen3.6-Coder et de tous les modèles exécutables sur un ordinateur portable
Tourne sur un Mac avec 24 Go : 58 tokens/s sur M4 Pro – utilisation complète sans serveur
Entraîné sur des tests réels : contrairement à ses prédécesseurs, Qwen 4 Coder a été entraîné par renforcement (reinforcement learning) sur les résultats de tests issus de véritables tâches GitHub, et non simplement sur un corpus de code
Licence Apache 2.0 sans restriction – intégrable dans des produits commerciaux, ajustable (fine-tuning), revendable

Pour un directeur informatique ou un responsable développement, Qwen 4 Coder est une bonne occasion de reconsidérer les dépenses d’abonnement : un modèle exécutable sur l’ordinateur portable de travail d’un développeur résout des tâches au niveau des flagships cloud.

La gamme de modèles est impressionnante, mais choisir le bon modèle n’est qu’une partie du travail. La différence entre « obtenir une réponse » et « obtenir un résultat fiable » tient à la capacité à formuler des requêtes précises et à vérifier les résultats. C’est exactement l’objet de notre module gratuit.

Qwen donne accès à des modèles puissants gratuitement – mais le résultat dépend de la façon dont vous formulez la tâche. 9 exercices pratiques pour le vérifier par vous-même.

Sans paiement requis • Notification au lancement

Rejoindre la liste

Qwen3-VL – Analyse d’images et de documents

Comprend les images, les vidéos (plus d’une heure), les documents PDF et le texte manuscrit. La reconnaissance de texte fonctionne dans 32 langues, y compris le russe : chargez un scan de contrat ou une photo du tableau blanc après une réunion et obtenez du texte structuré.

Exemple de reconnaissance de texte dans Qwen

Qwen3.5-Omni – Multimodalité native (mars 2026)

Texte, images, audio et vidéo sont traités au sein d’une architecture unique, sans encodeurs séparés. Meilleurs résultats de sa catégorie sur 215 tâches de compréhension audio et audio-visuelle. Supporte l’entrée et la sortie vocales en temps réel en russe, la recherche web intégrée et les appels d’outils externes. Il alimente le scénario Audio-Visual Vibe Coding : le développeur décrit les exigences à la voix et montre l’interface en vidéo — le modèle écrit le code.

Qwen3-TTS et Qwen-Image-2512 – Voix et images

Qwen3-TTS (licence ouverte) — synthèse vocale avec clonage de voix et génération en streaming pour assistants vocaux et narration. Qwen-Image-2512 — modèle de génération d’images mis à jour avec un détail photoréaliste et un rendu précis du texte : titres multilignes, paragraphes, éléments de marque — exactement là où Midjourney et DALL-E ont tendance à échouer.

Modèles pour déploiement local

Alibaba propose une gamme de modèles compacts pouvant être exécutés sur votre propre matériel — d’un ordinateur portable à un serveur d’entreprise :

Où exécuter	Modèle	Max. document	Idéal pour
Smartphone ou tablette	Qwen3-0.6B	~50 pages	Autocomplétion, prompts simples
Ordinateur portable ordinaire (4 Go RAM)	Qwen3-1.7B	~50 pages	Brouillons d’emails, résumés
Ordinateur portable puissant (8 Go RAM)	Qwen3-4B	~50 pages	Analyse de documents, qualité des anciens modèles top
Poste de travail (16 Go RAM)	Qwen3-8B	~200 pages	Documents complexes, tableaux, longs dialogues
Serveur de département (32 Go RAM)	Qwen3-14B	~200 pages	Assistant d’équipe complet
Serveur d’entreprise (48 Go RAM)	Qwen3-32B	~200 pages	Qualité proche des meilleurs modèles cloud
Cluster de serveurs (140+ Go)	Qwen3-235B	~400 pages	Qualité phare, rivalise avec GPT et Claude

Si votre entreprise ne peut pas envoyer de données sur des serveurs externes — finance, santé, secteur public — vous pouvez télécharger le modèle et le déployer dans votre réseau d’entreprise. Les données ne quittent jamais votre périmètre. C’est impossible avec ChatGPT ou Claude.
Qwen3-4B, tenant sur un ordinateur portable ordinaire (à partir de 4 Go de RAM), démontre une qualité comparable à un modèle qui nécessitait auparavant une baie de serveurs complète. C’est l’un des exemples les plus clairs de la rapidité avec laquelle l’efficacité des modèles ouverts progresse.

Un guide pratique pour choisir son matériel, installer Ollama et comparer les modèles locaux aux modèles cloud – dans notre guide des LLM locaux pour managers.

Qwen face à la concurrence

Le modèle phare Qwen3-235B rivalise, sur des benchmarks indépendants, avec DeepSeek-R1, o1, Grok-3 et Gemini 2.5 Pro. Pour les tâches professionnelles quotidiennes, les modèles de milieu de gamme offrent des résultats au niveau des meilleurs services cloud.

Critère	Qwen	ChatGPT / Claude	DeepSeek
Qualité du flagship	Très élevée (concurrent de GPT et Claude)	Très élevée	Très élevée
Accès web gratuit	Oui, chat.qwen.ai sans limites	Limité	Limité
Déployable sur serveur propre	Partiellement – jusqu’à la série 3.6 et Qwen 4 Coder ; la série 3.7 est fermée	Non	Partiellement
Coût de l’API	Le plus bas de sa catégorie (0,40 $/1,60 $ pour 3.7 Plus)	Moyen–élevé	Bas
Traitement des images et vidéos	Oui (3.7 Plus, 3.5-Omni)	Oui	Limité
Support du russe	Bonne	Excellente	Bonne

Pour 90 % des tâches professionnelles – rédaction, analyse de données, résumé de documents – Qwen 3.7 Plus offre un résultat comparable à Claude Sonnet 5, à un prix 5 fois inférieur.

Сравнить напрямую

Qwen 3.6 Plus vs Claude Sonnet 5 Qwen 3.6 Plus vs DeepSeek V4 Pro Qwen 3.6 Plus vs GPT-5.4 Mini

Qwen, DeepSeek, ChatGPT – des dizaines de modèles, mais les mêmes tâches à accomplir. Dans le module gratuit, vous testerez 9 scénarios réels de manager et découvrirez quel outil vous convient.

Sans paiement requis • Notification au lancement

Rejoindre la liste

Résultats de notre benchmark (mise à jour – juillet 2026)

Qwen est l’écosystème le plus largement représenté dans notre benchmark : 5 modèles dans le top 25 sur 42 testés. Tous sont accessibles directement depuis la Russie. Les résultats portent sur 80 scénarios de tâches managériales réelles (analyse, planification, communication, gestion d’équipe).

Les trois flagships – Qwen 3.6 Plus, Qwen 3.7 Max et Qwen 3.7 Plus – ont été détaillés plus haut avec les données de benchmark les plus récentes (classement, score, coût par tâche et date du test dans les encadrés sous leurs titres). Les deux modèles de milieu de gamme restants :

Qwen 3.6 Flash Entre dans les détails балл 7.6 #25 из 47 $0.008 за задачу доступен из РФ

протестировано: May 2026 · бенчмарк mysummit.school О модели → Сравнить →

Qwen 3.6 27B Entre dans les détails балл 7.6 #24 из 47 $0.017 за задачу доступен из РФ

протестировано: May 2026 · бенчмарк mysummit.school О модели → Сравнить →

Qwen 3.6 Flash devance Gemini 3.5 Flash à un prix plusieurs fois inférieur ; Qwen 3.6 27B est particulièrement fort en planification. En rapport qualité-prix, Qwen 3.6 Plus se montre plus convaincant que Claude Sonnet 5 et que GPT-5.4 Mini – à un prix nettement plus bas.

Le grand paradoxe de la gamme : Qwen 3.7 Max est plus cher que Qwen 3.6 Plus, mais se classe plus bas dans le classement général. Il l’emporte spécifiquement dans les catégories « planification » et « gestion d’équipe » – si ces tâches sont centrales pour vous, Max se justifie.

Qwen 3.6 Plus в 8 категориях задач

Шкала 0–10. Чем выше — тем лучше модель справилась с задачами

Le profil de Qwen 3.6 Plus sur les huit catégories illustre bien cet écart : un travail solide sur le texte et l’analyse – et des lacunes là où un contexte local est nécessaire.

Faiblesses communes à toute la gamme Qwen :

Droit du travail russe – invente des articles et sanctions inexistants. Les questions juridiques critiques ne doivent jamais être tranchées sans vérification.
Calculs financiers – erreurs arithmétiques systématiques.
Connaissance régionale – catégorie la plus faible pour tous les modèles Qwen.

Stratégie d’utilisation : Qwen 3.6 Plus est le modèle principal pour 80 % des tâches. Qwen 3.7 Plus convient aux opérations routinières à grand volume, quand le budget est critique. Qwen 3.7 Max ne se justifie que pour les tâches de planification et de gestion d’équipe, où il est spécifiquement plus fort.

Цена vs Качество: где модель на карте рынка

Каждая точка – модель из BenchLM. Выше – сильнее, левее – дешевле. Выделены модели из этого обзора.

Résultats interactifs complets →

Essayez par vous-même : planification + droit du travail français

Essayez vous-même

Планирование онбординга – Qwen vs DeepSeek vs Kimi

Vous

Tu es directeur/directrice des ressources humaines d'une entreprise IT à Lyon. Élabore un plan d'intégration (onboarding) pour un nouveau chef de service, pour les 90 premiers jours. ## Contexte - Entreprise : 85 personnes, développement produit - Le nouveau chef de service vient d'un concurrent et a amené 2 collaborateurs avec lui - L'équipe compte 12 personnes, dont 3 mécontentes de l'arrivée de ce « nouveau venu » - Format : hybride (3 jours au bureau, 2 jours en télétravail) ## Mission 1. Tiens compte des exigences du Code du travail : période d'essai pour un cadre, formalités d'embauche, formations obligatoires en santé-sécurité au travail 2. Plan d'intégration dans l'équipe – comment gérer la « résistance » 3. KPI à 30/60/90 jours avec des indicateurs concrets 4. Budget d'intégration : 8 000 EUR – comment le répartir 5. Risques : ce qui peut mal tourner et comment le détecter Format : plan structuré avec responsables et échéances.

Comparaison :

qwen3.6-plus · deepseek-v4-flash · kimi-k2.6

Ce qu’il faut observer : Qwen produit généralement une excellente structure de plan (la planification est sa catégorie la plus forte), mais dès qu’il cite le Code du travail, il invente souvent des articles et sanctions inexistants (la connaissance réglementaire locale est sa catégorie la plus faible). DeepSeek présente le même problème sur le droit français, et Kimi K2.6 – le meilleur planificateur du lot – reste lui aussi faible sur les détails réglementaires locaux.

Applications pratiques pour les managers

La plupart des managers qui essaient Qwen commencent par Qwen Chat – une interface web gratuite donnant accès aux modèles les plus récents. Elle prend en charge la recherche web, la génération d’images et l’analyse de documents sans aucun abonnement. Un bon point d’entrée pour évaluer l’outil avant d’en parler au service informatique.

Qwen gère très bien les documents en russe : scans de contrats, notes manuscrites, photos de tableaux blancs après une réunion. Chargez une photo – obtenez du texte structuré. La reconnaissance fonctionne dans 32 langues, avec une qualité en russe nettement supérieure à celle de nombreux outils occidentaux.

Un scénario à part : le déploiement d’entreprise sans cloud. Pour les entreprises interdites d’envoyer leurs données hors de leur périmètre, Qwen propose ce qui est indisponible chez ChatGPT ou Claude : les modèles peuvent être téléchargés et exécutés sur des serveurs propres. C’est la même logique que celle retenue par les structures étatiques qui construisent des systèmes d’IA souveraine – le contrôle des données prime sur le confort de l’accès cloud.

Enfin, Qwen3-Omni et Qwen3-TTS permettent de créer un assistant vocal en russe : reconnaissance vocale, traitement de la requête, synthèse vocale – le tout au sein d’un seul écosystème, sans avoir à connecter plusieurs services séparés.

Virage stratégique : de l’open source aux modèles fermés

Au premier semestre 2026, un changement est survenu qui modifie la proposition de valeur fondamentale de Qwen. Alibaba a fait basculer ses modèles phares – Qwen3.7-Max et Qwen3.7-Plus – vers un format fermé (API uniquement, sans poids ouverts). Cela place Alibaba en concurrence directe avec OpenAI et Anthropic pour les contrats d’API d’entreprise.

L’approche n’abandonne pas totalement l’open source : Qwen3.6-35B-A3B et Qwen 4 Coder sont sortis sous licence Apache 2.0. Mais la tendance est claire – les modèles les plus performants sont désormais fermés. Alibaba a confirmé qu’elle continuerait à publier des modèles ouverts, mais sans engagement clair sur un calendrier d’ouverture pour la série 3.7.

Dans le sillage de ce virage, des figures clés ont quitté l’équipe. En mars 2026, le responsable technique du projet, Lin Junyang, est parti en écrivant sur les réseaux sociaux : « me stepping down. bye my beloved qwen ». Le même jour, Yu Bowen, qui dirigeait le post-entraînement, a démissionné. Peu avant, Hui Binyuan, chercheur principal sur le code, était déjà parti. Un collègue de l’équipe a commenté : « Je sais que ce départ n’est pas ton choix. » L’action Alibaba a chuté de 5,3 % ce jour-là.

Pour un manager qui envisage Qwen, cela crée une situation ambivalente :

Les modèles open source restent solides – Qwen3.6-Plus et Qwen 4 Coder sont disponibles au téléchargement et à l’exécution locale. Pour les tâches où le contrôle des données est critique, rien n’a changé.
Les meilleurs nouveaux modèles ne sont accessibles que via API – si vous avez besoin d’un agent multimodal (3.7 Plus) ou de la meilleure qualité de raisonnement (3.7 Max), il faudra payer pour un accès cloud, comme avec ChatGPT ou Claude.
Instabilité des effectifs – le départ des architectes du projet crée une incertitude à long terme, même si le rythme des sorties n’en a pas encore souffert.

Limites et risques

Fermeture des flagships : Les modèles les plus puissants de la série 3.7 ne sont pas disponibles au téléchargement. Si votre stratégie reposait sur un écosystème entièrement ouvert, il faudra la revoir ou utiliser les modèles de la génération précédente.
Pertes de personnel : Le départ du responsable technique et du responsable du post-entraînement en mars 2026 est un signal préoccupant. Alibaba a réorganisé l’équipe en créant un état-major transversal pour le développement des modèles de base, mais les conséquences à long terme restent incertaines.
Censure et filtres : Comme tous les modèles chinois, Qwen intègre des restrictions sur certains sujets politiques et historiques. Rarement un problème pour les tâches professionnelles.
Risques géopolitiques : Le modèle appartient à Alibaba (Chine). Pour certaines organisations, cela peut constituer une contrainte lors de l’utilisation de l’API cloud. Solution : déploiement local des versions open source.
Qualité en russe : Malgré la prise en charge annoncée de 200+ langues, la qualité des réponses en russe peut être inférieure à celle en anglais. Il est recommandé de tester sur vos cas d’usage précis.
Intégrations : Les connecteurs prêts à l’emploi vers les services occidentaux – Slack, Notion, Google Workspace – sont bien moins nombreux que chez ChatGPT ou Claude. Qwen est mieux intégré aux outils d’entreprise chinois.

Tarifs et disponibilité

Option	Coût	Idéal pour
chat.qwen.ai	Gratuit	Essayer Qwen sans inscription API
Qwen3-0.6B / 4B (téléchargement)	Gratuit	Exécution sur ordinateur portable, contrôle total des données
Qwen 4 Coder 32B-A3B (téléchargement)	Gratuit (Apache 2.0)	Coder sur ordinateur portable, 82 % SWE-Verified
Qwen3-235B (téléchargement)	Gratuit	Flagship en local, cluster de serveurs requis
Qwen3.7-Plus (API, GA)	0,40 $ / 1,60 $ par million de tokens entrée/sortie	Agent multimodal, GUI grounding, contexte de 1 million
Qwen3.7-Max (API)	2,50 $ / 7,50 $ par million de tokens entrée/sortie	Flagship texte, scénarios agentiques, contexte de 1 million
Qwen3.6-Plus (preview)	Gratuit pendant la période de preview	Contexte de 1 million de tokens, code ouvert
Qwen3.5-Plus (API)	0,40 $ / 2,40 $ par million de tokens entrée/sortie	Tâches régulières, équilibre coût-qualité
Qwen3.5-397B-A17B (API)	0,39 $ / 2,34 $ par million de tokens entrée/sortie	Flagship sous licence ouverte

Pour comparaison : l’analyse équivalente d’un rapport de 100 pages via GPT-4o coûte environ 0,35 $ ; via Claude Sonnet, environ 0,55 $. Qwen3.7-Plus offre une analyse multimodale 3 fois moins chère que Claude Sonnet.

Qwen continue d’offrir trois points d’entrée : chat gratuit, API cloud bon marché et déploiement local. Mais avec la série 3.7, l’équilibre a changé : les modèles les plus puissants ne sont désormais accessibles que dans le cloud, tandis que les versions disponibles en local restent excellentes – mais ne sont plus les meilleures.

Vaut-il la peine d’essayer ?

Il y a six mois, l’argument principal en faveur de Qwen était simple : « la même chose que ChatGPT, mais gratuit et en open source ». En juillet 2026, le tableau s’est complexifié.

Le code ouvert n’a pas disparu – Qwen 4 Coder avec ses 82 % sur SWE-Verified et Qwen3.6-Plus sous Apache 2.0 restent les modèles open source les plus solides de leur catégorie. Pour les entreprises qui ont besoin d’un contrôle local des données, les alternatives restent rares. Mais les modèles les plus récents et les plus performants – Qwen 3.7 Max et 3.7 Plus – sont désormais fermés et accessibles uniquement via API. Alibaba suit la même voie qu’OpenAI et Anthropic : les modèles de recherche sortent en open source, les flagships commerciaux non.

Sur la plupart des tâches, tous les modèles de pointe offrent aujourd’hui des résultats comparables, et la différence n’est pas évidente au quotidien. Qwen 3.7 Plus, à 0,40 $/1,60 $, fait ce pour quoi Claude Sonnet 5 facture 2 $/10 $ – analyse multimodale, scénarios agentiques, travail avec l’écran. Pour les tâches à grand volume, c’est une économie sensible.

Le départ de développeurs clés et la réorganisation de l’équipe sont un risque à surveiller. Le rythme des sorties n’a pas encore ralenti, mais ce n’est pas une garantie. Si vous bâtissez des processus critiques sur Qwen, il est judicieux de prévoir une alternative – DeepSeek ou des modèles cloud dotés d’une structure d’entreprise plus stable.

Spécialisation

Passez des revues à la pratique

Programme complet : module Foundation avec pratique sur Qwen, ChatGPT, Claude, DeepSeek + spécialisations en gestion de projet, analyse et automatisation. Apprenez à choisir vos outils en connaissance de cause.

От pre-mortem до антикризисного плана

Переиспользуемые промпт-шаблоны

Сквозной кейс на реальном проекте

~300 часов экономии в год

Voir le programme du cours →

Sources

Qwen Chat – interface web gratuite – chat officiel d’Alibaba, fonctionne sans inscription
Site officiel de Qwen – documentation et description de tous les modèles
Modèles Qwen sur Hugging Face – 433 modèles ouverts à télécharger, plus de 300 millions de téléchargements
Dépôt Qwen sur GitHub – code source et documentation, plus de 40 dépôts
API via Alibaba Cloud Model Studio – accès cloud à Qwen-Plus et Qwen-Max

Qu’est-ce qui différencie Qwen ?

Ce que Qwen sait faire en juillet 2026

Principaux modèles Qwen (juillet 2026)

Qwen 3.7 Max – Flagship agentique (mai 2026)

Qwen 3.7 Plus – Agent multimodal (disponibilité générale – 1er juin 2026)