mysummit.school - Blog IA pour les Managers

40 cas GigaChat de Sber : ce que dit vraiment notre benchmark

27 min de lecture

Sber – la plus grande banque russe, qui développe aussi sa propre famille de modèles d’IA, GigaChat – a publié un dossier promotionnel : quarante études de cas d’entreprises ayant adopté GigaChat et qui en détaillent les bénéfices. EdTech, MedTech, HRTech, cybersécurité, PropTech. De jolies fiches, des chiffres précis, de vraies startups.

Le dossier promotionnel de Sber

Sur l’image : le visuel « Un pas en avant » de l’accélérateur Sber500×GigaChat – 40 startups dans 9 secteurs. Effets annoncés : processus jusqu’à x16 plus rapides, coûts réduits jusqu’à 90 %, automatisation des tâches jusqu’à 95 %, chiffre d’affaires en hausse jusqu’à 30 %.

Nous disposons d’un benchmark : 29 modèles, 4 308 évaluations indépendantes sur des tâches managériales. GigaChat y occupe la dernière place, 29e sur 29 à l’issue de la deuxième vague de tests. Cela crée une situation intéressante.

Non pas parce que Sber mentirait. Les cas sont réels, les startups existent, l’automatisation fonctionne. La vraie question est ailleurs : était-ce le modèle optimal pour les tâches que ces entreprises devaient résoudre ?

Lire la suite
40 cas GigaChat de Sber : ce que dit vraiment notre benchmark
280x moins cher en deux ans : l'économie de l'IA a basculé
11 min

280x moins cher en deux ans : l'économie de l'IA a basculé

En 2023, une requête à GPT-4 coûtait suffisamment cher pour qu’il faille compter avec soin. En 2025, une requête équivalente est devenue 280 fois moins chère. Pas de 280 pour cent – 280 fois moins. En deux ans, le coût d’utilisation de l’IA est passé d’une barrière à une erreur d’arrondi.

Le Stanford AI Index – rapport annuel qui agrège des données sur l’industrie de l’IA à partir de centaines de sources – a documenté cet effondrement dans son édition 2025. Et le rapport 2026 a ajouté du contexte : les investissements en IA ont explosé à 285,9 milliards de dollars, les consommateurs reçoivent 172 milliards de dollars de valeur annuelle, et les data centers consomment autant d’électricité que l’État de New York. L’économie a basculé – mais pas comme on l’attendait.

L'IA s'est diffusée plus vite qu'Internet – mais 62 % des utilisateurs sont restés au point de départ
11 min

L'IA s'est diffusée plus vite qu'Internet – mais 62 % des utilisateurs sont restés au point de départ

En avril 2026, Stanford HAI a publié son neuvième rapport annuel AI Index Report – la synthèse la plus complète sur l’état de l’industrie de l’intelligence artificielle. Les gros titres sont prévisiblement optimistes : l’adoption en entreprise a atteint 88 %, l’IA générative a dépassé Internet en vitesse de diffusion, la valeur pour les consommateurs des outils GenAI est estimée à 172 milliards de dollars par an. Mais derrière les chiffres, un problème familier apparaît.

4 techniques de prompting testees sur 7 modeles : guide d'atelier
36 min

4 techniques de prompting testees sur 7 modeles : guide d'atelier

“Analyse ce projet et fais des recommandations” – un seul prompt, sept modeles, et GPT-5.4 a produit 2 231 mots de conseils vagues, tandis que Claude Sonnet a aligne 11 formules elogieuses du type “excellente structure budgetaire”. Il a suffi de reecrire la requete selon une structure en cinq elements pour que les sept modeles se cantonnent a 346–443 mots, et les compliments disparaissent. Economie de tokens : de 41 % a 79 % selon le modele.

Ce ne sont pas des theories. Ce sont des donnees issues de l’atelier “Prompt Engineering en pratique”, que j’ai anime lors de la conference IIBA. Un brief projet, quatre techniques, sept modeles, 28 executions – et 0,054 $ pour le tout. Moins cher qu’un cafe au distributeur.

Quand les benchmarks IA perdent leur sens : comment choisir un modèle
7 min

Quand les benchmarks IA perdent leur sens : comment choisir un modèle

En mars, nous avons décortiqué le fonctionnement des benchmarks LLM – GPQA Diamond, SWE-bench, Chatbot Arena. En avril, nous avons testé 53 modèles et découvert que l’écart de qualité entre les meilleurs modèles se compte en dixièmes de point, alors que l’écart de prix s’étale sur trois ordres de grandeur.

Vient maintenant la question suivante. Et si les benchmarks eux-mêmes cessaient de fonctionner ?

99 % de la qualité pour 1,4 % du prix : ce qui ne va pas sur le marché des modèles IA
9 min

99 % de la qualité pour 1,4 % du prix : ce qui ne va pas sur le marché des modèles IA

La plupart des managers choisissent un modèle IA de la même manière : ils prennent le plus cher disponible. La logique est limpide – plus cher, c’est mieux. C’est ainsi que fonctionnait le logiciel d’entreprise depuis vingt ans.

Le marché des modèles IA en 2026 fonctionne différemment. Le coût d’une requête varie de 0,0001 $ à 0,17 $ – trois ordres de grandeur. Et la différence réelle de qualité entre les dix meilleurs modèles ? 0,24 point sur une échelle de cinq. Pendant ce temps, Wharton / GBK Collective constate qu’un tiers des projets IA en entreprise ne dépasse pas le stade du pilote. Et Epoch AI montre que seuls 5,6 % des utilisateurs exploitent réellement l’IA en profondeur.

La question n’est peut-être pas de savoir quel modèle est le meilleur, mais plutôt si payer le prix fort pour un modèle premium produit un résultat proportionnellement meilleur pour les tâches managériales courantes.

Nous avons vérifié. La réponse s’est avérée plus brutale que prévu.

Tirer le maximum de YandexGPT : ce qui marche et ce qui échoue
15 min

Tirer le maximum de YandexGPT : ce qui marche et ce qui échoue

En Russie, des millions de personnes utilisent Alice chaque jour – non par choix, mais parce qu’elle est gratuite, intégrée au navigateur Yandex et fonctionne sans VPN. YandexGPT, le modèle qui anime Alice, est le meilleur modèle russe de notre benchmark, mais reste loin derrière GPT-5.4. (Pour un lecteur extérieur : Yandex est le géant russe de la tech, l’équivalent local de Google, et Alice est son assistant conversationnel grand public.)

Peut-on en obtenir des réponses proches de celles de GPT, à condition d’apprendre à bien formuler ses demandes ? Nous l’avons vérifié dans une expérience : dix techniques de prompt, six tâches de management, deux juges LLM indépendants. Réponse courte : oui, c’est possible – mais toutes les techniques ne marchent pas, et certaines aggravent la situation.

Voici des gabarits concrets que vous pouvez copier dans le chat dès maintenant, et les anti-patterns à éviter.

LLM locaux pour managers : ce que vous pouvez vraiment faire tourner chez vous
24 min

LLM locaux pour managers : ce que vous pouvez vraiment faire tourner chez vous

Toute personne qui travaille suffisamment longtemps avec ChatGPT ou Claude finit tôt ou tard par se poser cette question : est-il possible de faire tourner quelque chose de comparable directement sur son ordinateur portable – sans abonnement, sans fuite de données, sans dépendre de serveurs distants ?

En 2026, la réponse est oui, mais avec des nuances qui comptent plus que la réponse elle-même.

Cet article s’adresse à celles et ceux qui utilisent déjà des LLM en cloud et veulent comprendre ce qu’apporte réellement l’exécution locale, quel matériel il faut, et où les attentes se heurtent à la réalité. Sans plongée technique, mais avec des chiffres concrets.

P5.express et l'IA agentique : où elle aide, où elle casse tout
28 min

P5.express et l'IA agentique : où elle aide, où elle casse tout

Dans l’univers PMI, la gestion de portefeuille est souvent perçue comme un édifice monumental : comités, Tableau, des centaines de champs dans Jira, des réunions de suivi hebdomadaires avec des dizaines de slides. P5.express propose une autre voie. Trois cycles, cinq documents, deux rôles. Le système tient sur une seule page.

C’est précisément à ce type de système qu’il est pertinent d’associer une IA agentique : l’architecture minimaliste est compréhensible, les rôles sont clairs, les données sont structurées. Mais « pertinent » ne veut pas dire « partout ». Certaines parties de P5.express cessent de fonctionner lorsqu’on les automatise – non pas parce que l’IA est mauvaise, mais parce que le sens même de ces parties réside dans le processus humain.

Ci-dessous – une analyse cycle par cycle. Ce qu’il vaut la peine de déléguer à un agent, ce qu’il vaut mieux laisser aux humains, et quel modèle choisir en pratique.