280x moins cher en deux ans : l'économie de l'IA a basculé

11 min de lecture
Stanislav Belyaev
Stanislav Belyaev Engineering Leader chez Microsoft
280x moins cher en deux ans : l'économie de l'IA a basculé

En 2023, une requête à GPT-4 coûtait suffisamment cher pour qu’il faille compter avec soin. En 2025, une requête équivalente est devenue 280 fois moins chère. Pas de 280 pour cent – 280 fois moins. En deux ans, le coût d’utilisation de l’IA est passé d’une barrière à une erreur d’arrondi.

Le Stanford AI Index – rapport annuel qui agrège des données sur l’industrie de l’IA à partir de centaines de sources – a documenté cet effondrement dans son édition 2025. Et le rapport 2026 a ajouté du contexte : les investissements en IA ont explosé à 285,9 milliards de dollars, les consommateurs reçoivent 172 milliards de dollars de valeur annuelle, et les data centers consomment autant d’électricité que l’État de New York. L’économie a basculé – mais pas comme on l’attendait.

280x – ce qui s’est passé avec les coûts

Le Stanford AI Index 2025 a introduit une métrique qui mérite son propre paragraphe : le coût d’inférence des modèles de niveau GPT-3.5 a chuté 280 fois depuis la sortie de ChatGPT fin 2022. Ce n’est pas un effet de substitution d’un modèle cher par un modèle bon marché. C’est une baisse de prix à qualité comparable – grâce à la concurrence entre fournisseurs, à l’optimisation de l’infrastructure et à la baisse du coût des puces.

Pour donner du contexte : sur la même période, les smartphones ont baissé d’environ 15 %. Le stockage cloud, d’environ 30 %. Les billets d’avion, à peu près rien. Et l’inférence IA, 280 fois.

On le voit dans nos propres données. Quand nous avons testé 53 modèles au printemps 2026, la requête la moins chère coûtait 0,0001 $, la plus chère 0,17 $. Différence de prix : 1 600 fois. Différence de qualité entre les dix meilleurs modèles : 0,24 point sur cinq. Un marché où le prix tombe plus vite que la qualité ne monte – c’est un marché qui a basculé.

Concrètement, cela signifie une chose : l’accès à l’IA a cessé d’être un problème. En 2023, un manager pouvait dire « nous n’avons pas le budget pour GPT-4 ». En 2026, cela sonne à peu près comme « nous n’avons pas le budget pour l’e-mail ». Des modèles économiques comme Qwen3.5 9B ou DeepSeek V3.2 livrent 85 à 90 % de la qualité des modèles phares pour des fractions de centime par requête. Pour un brouillon d’e-mail, un résumé de document, la préparation d’un ordre du jour de réunion – la différence entre un modèle à 0,0002 $ et un autre à 0,016 $, vous ne la remarquerez pas.

La barrière s’est déplacée. Elle n’est plus dans le prix d’accès, mais dans la capacité à s’en servir.

L’argent coule à flots

Pendant que le coût d’usage baissait, le volume des investissements faisait l’inverse.

L’AI Index 2026 documente : les investissements privés en IA aux États-Unis ont atteint 285,9 milliards de dollars en 2025. À titre de comparaison – l’année précédente, c’était 109,1 milliards. Une multiplication par 2,6 en un an. En valeur absolue, c’est plus que le PIB de la plupart des pays du monde.

Explosion des investissements IA : États-Unis vs Chine

La deuxième place revient à la Chine, avec 12,4 milliards de dollars. C’est 23 fois moins que les États-Unis. Stanford apporte cependant une nuance : les chiffres chinois n’incluent pas les fonds d’État ni les investissements via des entreprises publiques, qui jouent un autre rôle en Chine que dans l’écosystème américain du capital-risque. L’écart réel est probablement plus faible. Mais même avec cet ajustement, l’ampleur de la domination américaine impressionne.

Autre chiffre : en 2025, 1 953 nouvelles entreprises d’IA financées par du capital-risque sont apparues aux États-Unis. Soit dix fois plus que dans le pays qui suit. Pas deux fois, pas trois fois – dix fois.

Où va cet argent ? La puissance de calcul globale dédiée à l’IA croît de 3,3 fois par an depuis 2022 et a atteint l’équivalent de 17,1 millions de H100. Nvidia contrôle plus de 60 % de cette capacité. Le coût d’entraînement des modèles frontières continue de monter – pendant que l’inférence baisse. Entraîner un modèle et l’utiliser : deux économies distinctes, qui bougent dans des directions opposées.

Voici une expérience de pensée : si l’inférence a baissé de 280 fois et que les investissements ont été multipliés par 2,6 – alors le volume d’usage a augmenté de plusieurs ordres de grandeur. L’argent n’a pas disparu, il a glissé du paiement par requête vers le paiement de l’infrastructure. L’utilisateur paie moins. Le système dans son ensemble, plus.

Valeur pour le consommateur – 172 milliards de dollars

L’AI Index 2026 avance une estimation qui mérite qu’on s’y arrête : la valeur de l’IA générative pour les consommateurs américains représenterait 172 milliards de dollars par an. Ce n’est ni le chiffre d’affaires des entreprises, ni la taille du marché – c’est l’estimation du bénéfice perçu par les utilisateurs, dont beaucoup ne paient rien.

La valeur médiane par utilisateur a triplé entre 2025 et 2026. C’est une dynamique inhabituelle. Habituellement, lorsqu’une technologie se diffuse massivement, la valeur par utilisateur baisse – les nouveaux venus sont moins engagés que les pionniers. Ici, c’est l’inverse. Soit les utilisateurs apprennent vite à en tirer davantage, soit les outils sont devenus nettement meilleurs, soit un peu des deux.

Mais voici ce qui interpelle : 172 milliards de valeur consommateur face à 285,9 milliards d’investissements – ce n’est pas encore l’équilibre qui rassure les investisseurs. Bien sûr, valeur consommateur et chiffre d’affaires sont deux choses différentes. Bien sûr, un investissement est un pari sur l’avenir, pas l’achat d’un résultat présent. Mais a minima, une question se pose : qui, et quand, va commencer à convertir cette utilité en argent ?

Les chiffres expliquent pourquoi la valeur se crée en principe. Mais comment elle apparaît concrètement sur les tâches d’un manager – c’est une conversation qui commence non pas avec un rapport, mais avec la pratique.

Comment transformer l'IA d'un 'jouet amusant' en outil avec résultats mesurables ? 9 tâches managériales avec l'IA — gratuit.

Sans paiement requis • Notification au lancement

Rejoindre la liste

Modèle cher ne veut pas dire meilleur modèle

La chute du coût d’inférence crée un paradoxe que nous avons détaillé dans l’analyse de 53 modèles : si un modèle bon marché livre 99 % de la qualité d’un modèle cher, pour quoi payez-vous exactement en choisissant le premium ?

Pour rappel, les chiffres clés : l’écart de prix entre le modèle le moins cher et le plus cher de notre benchmark – 1 600 fois. L’écart de qualité entre le top 10 – 0,24 point. Les modèles dans la fourchette 0,001 à 0,003 $ par requête obtiennent régulièrement 4,4 à 4,7 sur cinq pour les tâches managériales. Les modèles phares, 4,7 à 4,8.

Le Stanford AI Index confirme avec ses macro-données : l’effondrement du coût d’inférence ne s’est pas accompagné d’une chute proportionnelle de la qualité. Les modèles sont devenus moins chers et meilleurs en même temps. Ce n’est pas un jeu à somme nulle.

Pour un manager, cela veut dire que le choix « premium ou budget » est un faux dilemme. La bonne question, c’est « quel modèle pour quelle tâche ». Les principales dépenses d’IA se cachent rarement dans le prix des tokens d’API – elles se logent dans l’intégration, la formation des équipes et le temps perdu à mal utiliser l’outil.

Bien sûr, pour 20 % des tâches – analyse stratégique, données ambiguës, documents destinés à la direction – la différence entre modèles existe vraiment et justifie le surcoût. Mais pour les 80 % restants, payer le premium, c’est précisément ce que nous avons appelé « la taxe IA » : une dépense qui ressemble à un investissement et fonctionne comme une habitude.

Coûts cachés

Jusqu’ici, nous avons parlé de la baisse du coût pour l’utilisateur. Maintenant – de ce que cette baisse coûte au système.

L’AI Index 2026 livre des chiffres qui figurent rarement dans les supports marketing des fournisseurs.

Coûts cachés de l’IA : l’iceberg

La puissance des data centers dédiés à l’IA a atteint 29,6 gigawatts. À titre de comparaison – c’est comparable à la consommation de pointe d’électricité de l’État de New York. Pas Manhattan – l’État tout entier. Et ce n’est que la capacité actuelle, sans compter les chantiers annoncés.

Les émissions de CO₂ liées à l’entraînement des modèles frontières montent avec chaque génération. Selon les estimations de Stanford, entraîner Grok 4 a coûté environ 72 816 tonnes de dioxyde de carbone. Pour l’échelle : l’empreinte annuelle d’une petite ville.

Mais le chiffre peut-être le plus inattendu, c’est l’eau. L’inférence de GPT-4o pourrait consommer plus d’eau que ce qu’il en faut pour l’approvisionnement en eau potable de 1,2 million de personnes. Pas l’entraînement – l’inférence. Chaque requête, chaque brouillon d’e-mail, chaque « résume-moi ce document ». Multipliez par des centaines de millions d’utilisateurs.

C’est le cas typique où « gratuit pour l’utilisateur » ne veut pas dire « gratuit ». Le coût s’est déplacé du budget du manager vers le budget énergétique de la planète. Je ne suis pas certain que l’industrie ait une réponse claire à cette question – pour l’instant, toutes les conversations renvoient à des plans de transition vers le nucléaire et les renouvelables, qui existent surtout au format communiqué de presse.

Empreinte écologique, risques juridiques, choix d'outil — essayez l'IA sur 9 tâches managériales réelles. Gratuit.

Sans paiement requis • Notification au lancement

Rejoindre la liste

Ce que cela signifie pour un manager

Récapitulons. En deux ans, le coût d’usage de l’IA a chuté 280 fois, et les investissements annuels ont grimpé à 286 milliards de dollars. En parallèle, la valeur consommateur pour les seuls Américains a atteint 172 milliards de dollars – et c’est l’électricité et l’eau qui paient la facture, à des échelles qu’on jugeait absurdes il y a peu pour un service informationnel.

Qu’est-ce qui compte en pratique ?

Premier point : l’accès à l’IA est un problème résolu. Si vous ou votre équipe n’utilisez pas l’IA au travail, la raison n’est pas le prix. Elle est ailleurs : on ne sait pas où l’appliquer, on n’a pas l’habitude de formuler les demandes, on craint d’obtenir un mauvais résultat, les politiques internes n’ont pas suivi. Ce sont de vraies barrières. Mais elles ne sont pas financières.

Deuxième point : l’écart entre modèles se réduit, celui entre utilisateurs s’élargit. Google Cloud, dans son rapport sur le ROI, montre que les entreprises qui obtiennent un retour réel de l’IA n’y parviennent pas en achetant un modèle cher, mais en associant précisément l’outil à la tâche et en formant les gens. Un modèle à 0,002 $ entre les mains d’une personne qui sait formuler une demande donne plus qu’un modèle à 0,17 $ entre celles de quelqu’un qui tape « fais-moi quelque chose de joli ».

Troisième point : les coûts écologiques ne sont pas une abstraction, c’est un facteur qui va commencer à peser sur la régulation, la tarification et le reporting d’entreprise. Pour l’instant, cela ne touche pas directement votre budget. Mais si vous bâtissez une stratégie IA à deux ou trois ans, il vaut mieux en tenir compte.

Et voici ce que les conversations sur « la révolution du low cost » laissent souvent de côté. Oui, l’IA est devenue accessible à tous. Mais accessibilité de l’outil et maîtrise de l’outil sont deux choses différentes. Un marteau, il y en a dans chaque foyer, mais cela ne fait pas de chacun un charpentier. Le coût de l’IA a baissé 280 fois. Le coût pour apprendre à s’en servir, non.

C’est peut-être là le vrai basculement de 2025-2026. L’avantage compétitif s’est déplacé de « nous avons accès à l’IA » vers « nos gens savent travailler avec ». Le premier coûte désormais une fraction de centime par requête. Le second reste cher, long, et sans garantie.

Mais si 172 milliards de valeur consommateur sont déjà générés – c’est que quelqu’un est en train d’acquérir ces compétences. La seule question, c’est à quelle vitesse vous le faites, vous.

Ceci est le deuxième article de la série « Stanford AI Index 2026 ». Le premier portait sur le paradoxe de l’adoption : pourquoi, malgré cette baisse des coûts, l’usage profond de l’IA reste rare. Le suivant abordera la « frontière dentelée » des capacités de l’IA : tâches où les modèles dépassent déjà les experts, et tâches où ils échouent encore.

Spécialisation

L'accès est résolu. Reste la compétence.

Un modèle à 0,002 $ entre les mains d'un manager formé donne plus que GPT-5 entre celles d'un débutant. Le cours MySummit.school – prompt engineering, esprit critique avec l'IA, manipulation sécurisée des données et choix d'outil par tâche.

От pre-mortem до антикризисного плана
Переиспользуемые промпт-шаблоны
Сквозной кейс на реальном проекте
~300 часов экономии в год
Stanislav Belyaev

Stanislav Belyaev

Engineering Leader chez Microsoft

18 ans a diriger des equipes d'ingenieurs. Fondateur de mysummit.school. 700+ diplomes chez Yandex Practicum et Stratoplan.