Почему 95% компаний проваливают внедрение AI: исследование MIT о разрыве в генеративном ИИ

16 мин чтения
Почему 95% компаний проваливают внедрение AI: исследование MIT о разрыве в генеративном ИИ

Компании вложили $30–40 миллиардов в генеративный ИИ. ChatGPT используют 80% организаций. Пилотные проекты запускают все, от стартапов до Fortune 500. Заголовки в LinkedIn кричат о революции. Но вот что показывает исследование MIT NANDA из 300+ проектов внедрения: 95% организаций получают нулевую отдачу от инвестиций в корпоративный AI.

Не ноль процентов роста. Именно ноль – никакого измеримого влияния на финансовый результат. При этом те 5%, которые перешли на другую сторону разрыва, извлекают миллионы долларов ценности из тех же самых технологий.

Исследователи из MIT назвали это Разрыв в генеративном ИИ (The GenAI Divide) – пропасть между компаниями, которые активно внедряют AI-инструменты, но не получают результатов (95%), и теми, кто строит системы с возможностью обучения и извлекает реальную ценность (5%). Это не разрыв в технологиях или бюджетах. Это разрыв в подходе: высокое внедрение без трансформации против глубокой интеграции с измеримыми бизнес-результатами.

Парадокс в том, что проблема не в качестве моделей, не в регуляциях, не в талантах. Главный барьер – Learning Gap, разрыв в обучаемости. Большинство AI-систем не запоминают контекст, не адаптируются к рабочим процессам, не учатся на обратной связи. Они статичные. А бизнесу нужны системы, которые эволюционируют вместе с процессами.

В этой статье – разбор исследования MIT с анализом 52 организаций, 153 топ-менеджеров и 300+ публичных кейсов внедрения. Почему компании застревают. Что делают те 5%, которые прорываются. И главное – как перейти от пилотов, которые буксуют, к системам, которые работают.

Разрыв в цифрах: высокое внедрение, низкая трансформация

Казалось бы, всё идёт по плану. 80% организаций исследовали или пилотили ChatGPT и Copilot. Почти 40% уже развернули эти инструменты – цифры, которые подтверждает и совместное исследование Brookings Institution и Bain & Company с опросом 800+ руководителей. Сотрудники используют AI для писем, саммари, базового анализа. Эффективность растёт. Но есть нюанс – все эти улучшения на индивидуальном уровне, а не на уровне финансовых показателей компании.

А вот с системами корпоративного уровня – кастомными или от поставщиков – всё гораздо хуже. 60% организаций оценивали такие решения. До пилота дошли только 20%. До промышленной эксплуатации – всего 5%. Остальные 95% застряли из-за хрупких рабочих процессов, отсутствия контекстного обучения и несоответствия реальным бизнес-процессам.

Провал от пилота к production

Интересно, что CEO на LinkedIn рассказывают об AI-трансформации. Но когда исследователи MIT проанализировали 8 крупных секторов экономики, реальные революционные изменения нашлись только в двух:

Индекс AI-трансформации по секторам экономики

  • Технологический сектор (индекс 2,0 из 5): новые игроки вроде Cursor бросают вызов Copilot, рабочие процессы разработчиков меняются
  • Медиа и телеком (1,5 из 5): контент на базе AI, меняющаяся динамика рекламы, но действующие игроки всё ещё растут

Остальные шесть секторов – профессиональные услуги, здравоохранение, ритейл, финансовые услуги, промышленность, энергетика – показали индекс 0,5 или ноль. Пилоты есть. Бюджеты выделены. Но структурных изменений нет. Никаких новых лидеров рынка. Никаких изменений в поведении клиентов. Никаких сдвигов в бизнес-моделях.

COO производственной компании из среднего ценового сегмента выразил это предельно чётко:

“Хайп в LinkedIn говорит, что всё изменилось. Но в наших операциях ничего фундаментального не сдвинулось. Мы обрабатываем некоторые контракты быстрее – вот и все изменения.”

Это и есть разрыв в генеративном ИИ. Компании на одной стороне экспериментируют, тратят бюджеты, запускают пилоты – и получают ноль. Компании на другой стороне внедряют системы с возможностью обучения, которые адаптируются к их процессам – и извлекают миллионы.

Разрыв в обучаемости: почему ChatGPT работает для писем, но проваливается в критических процессах

Самые показательные данные – из опроса пользователей. Когда спрашиваешь людей про ChatGPT для личных задач, отзывы восторженные. Гибкий. Знакомый интерфейс. Качество ответов лучше, чем у корпоративных инструментов. Даже когда и те, и другие используют одни и те же модели.

Но вот парадокс. Те же самые пользователи резко меняют мнение, когда речь заходит о критически важных задачах.

Юрист из средней по размерам юридической фирмы рассказывает:

“ChatGPT отлично подходит для мозгового штурма и первых черновиков. Но он не сохраняет знания о предпочтениях клиентов, не учится на прошлых правках. Он повторяет те же самые ошибки. Для каждой новой сессии приходится вводить полный контекст заново. Для критически важной работы мне нужна система, которая накапливает знания и улучшается со временем.”

На курсе мы показываем, как решить проблему «забывчивого AI» и построить системы с памятью и адаптивностью для критических бизнес-процессов

Без платёжных данных • Доступ сразу после регистрации

Начать обучение

Исследователи MIT задали прямой вопрос: для какого типа задач вы предпочли бы AI, а для какого – человека?

Быстрые задачи (письма, резюме, базовый анализ): 70% предпочитают AI Сложные проекты (многонедельная работа, управление клиентами): 90% предпочитают людей

Предпочтения AI vs человек

Видите разрыв? AI уже выиграл войну за простую работу. Но для чего-то сложного или долгосрочного – люди доминируют 9 к 1. Граница проходит не по интеллекту. Граница – это память, адаптивность, способность к обучению. То есть именно те характеристики, которых нет у текущих систем.

Когда опросили пользователей про барьеры для интеграции в основные рабочие процессы, топ-ответы были предельно конкретными:

  • “Не учится на нашей обратной связи” (66%)
  • “Слишком много ручного контекста требуется каждый раз” (63%)
  • “Не настроить под наши специфичные процессы” (58%)
  • “Ломается в редких случаях и не адаптируется” (55%)

Это не мелкие проблемы с интерфейсом. Это фундаментальный разрыв в обучаемости, который и определяет разрыв в генеративном ИИ.

Теневая AI-экономика: почему сотрудники используют личные инструменты вместо корпоративных

Парадокс продолжается. Только 40% компаний купили официальные корпоративные подписки на LLM. Но 90% сотрудников этих же компаний регулярно используют AI-инструменты для рабочих задач – через личные аккаунты ChatGPT, Claude, или другие потребительские инструменты.

Почти каждый человек использует LLM в той или иной форме для работы. Многие – несколько раз в день, каждый день, причём исследование Stanford HAI показывает, что активнее всего AI используют именно знаниевые работники – менеджеры, аналитики, специалисты, которым он реально помогает в повседневных задачах. При этом официальные AI-инициативы их компаний застряли в пилотной стадии.

Эта “теневая AI-экономика” демонстрирует кое-что важное: индивидуумы могут успешно пересечь разрыв в генеративном ИИ, когда им дают доступ к гибким, отзывчивым инструментам. Проблема не в пользователях. Проблема в том, как компании подходят к корпоративному внедрению.

Передовые организации начинают учиться на этом паттерне. Они анализируют, какие личные инструменты сотрудников реально дают ценность, прежде чем закупать корпоративные альтернативы. Они не борются с теневым AI – они строят на нём.

Узнайте, как правильно внедрять AI-инструменты в бизнес-процессы – без потери продуктивности и с измеримой отдачей от инвестиций

Без платёжных данных • Доступ сразу после регистрации

Начать обучение

Почему пилоты застревают: инвестиционный перекос и организационный дизайн

Половина всех GenAI-бюджетов идёт на продажи и маркетинг. Логика понятна – эти функции на виду, удобны для совета директоров, легко измерить ROI через объём демонстраций или время отклика на письма. Но исследование MIT показывает парадокс: самые драматичные сокращения издержек часто приходят из автоматизации административных функций.

Вице-президент по закупкам в фармацевтической компании из списка Fortune 1000 выразил проблему чётко:

“Если я покупаю инструмент, чтобы моя команда работала быстрее – как мне квантифицировать этот эффект? Как обосновать это CEO, когда это не будет напрямую увеличивать выручку или снижать измеримые издержки? Я могу аргументировать, что это помогает нашим учёным получать инструменты быстрее. Но это на несколько степеней удалено от влияния на конечный финансовый результат.”

Это и есть инвестиционный перекос. Деньги текут туда, где метрики очевидны, а не туда, где эффект максимальный. Компании, которые пересекли разрыв в генеративном ИИ, нашли другой паттерн:

Результаты в клиентской зоне:

  • Скорость квалификации лидов: +40%
  • Удержание клиентов: +10% через автоматизированные последующие контакты

Результаты в административной зоне:

  • Отказ от аутсорсинга бизнес-процессов: $2–10M ежегодно (клиентский сервис, обработка документов)
  • Сокращение затрат на агентства: –30% (внешние креативные услуги, производство контента)
  • Автоматизация проверок рисков: $1M сэкономлено на аутсорсинге управления рисками

Обратите внимание – реальные выгоды пришли не от сокращения внутренних сотрудников. Они пришли от замены контрактов с аутсорсинговыми компаниями, урезания комиссий агентств, и перевода дорогих консультантов во внутренние возможности на базе AI.

Разрабатывать или покупать: почему внутренняя разработка проваливается в 2 раза чаще

Ещё один паттерн, который определяет разрыв в генеративном ИИ – организационный дизайн. Исследование MIT показывает:

  • Стратегические партнёрства (покупка): 66% доходят до успешного внедрения
  • Внутренняя разработка: 33% доходят до успешного внедрения

Build vs Buy success rates

Важная оговорка: это корреляция, не обязательно причинно-следственная связь. Возможно, компании, которые выбирают внешние партнёрства, изначально имеют другую терпимость к рискам или зрелость процессов закупки. Но масштаб разницы – в 2 раза – достаточно значительный, чтобы обратить внимание.

Почему внутренняя разработка чаще проваливается? Три основные причины из интервью:

  1. Недооценка сложности интеграции в рабочие процессы – команды думают, что достаточно хороший LLM + промпт-инженеринга. На практике нужна глубокая кастомизация под специфические процессы.

  2. Отсутствие экспертизы в предметной области – внутренние команды разработчиков знают технологию, но не знают нюансов закупок, юридических или финансовых процессов, для которых строят инструменты.

  3. Нет ответственности за бизнес-результаты – метрики успеха смещаются в сторону технических показателей (точность модели, время отклика), а не бизнес-метрик (сокращение затрат, экономия времени, снижение ошибок).

Стратегические партнёрства решают эти проблемы – поставщик знает предметную область, несёт ответственность за результаты, и привносит лучшие практики из других клиентов.

Как преодолеть разрыв: что делают правильные 5%

Организации, которые успешно пересекли разрыв в генеративном ИИ, не ждали идеальных сценариев применения. Они не строили всё сами. Они делали три вещи иначе:

1. Требовали системы с возможностью обучения

66% руководителей хотят системы, которые учатся на обратной связи. 63% требуют сохранения контекста. Но большинство корпоративных инструментов этого не дают.

Передовые компании выбирают поставщиков, которые строят агентский AI – системы с постоянной памятью и итеративным обучением. Не просто обёртку над LLM. Настоящие агенты, которые:

  • Сохраняют контекст между сессиями
  • Учатся на исправлениях пользователей
  • Адаптируются к изменениям в процессах

2. Начинали с узких сценариев с высокой ценностью

Успешные стартапы не пытаются автоматизировать всё сразу. Они внедряются в некритичные или смежные процессы со значительной кастомизацией, доказывают явную ценность, потом масштабируются в основные рабочие процессы.

Примеры категорий, которые показали успех из выборки MIT:

  • Голосовой AI для резюмирования звонков и маршрутизации
  • Автоматизация документов для контрактов и форм
  • Генерация кода для повторяющихся инженерных задач

Проблемные категории – те, которые требовали сложной внутренней логики, непрозрачной поддержки решений, или оптимизации на базе проприетарных эвристик.

3. Выбирали поставщиков как партнёров по аутсорсингу, а не как SaaS

Лучшие покупатели относятся к AI-стартапам не как к поставщикам софта, а как к поставщикам бизнес-услуг. Они:

  • Требуют глубокую кастомизацию под внутренние процессы и данные
  • Сравнивают по операционным результатам, а не по бенчмаркам моделей
  • Партнёрствуют через неудачи на ранних этапах, относятся к внедрению как к совместной эволюции
  • Инициируют AI-проекты от менеджеров на передовой, а не от центральных лабораторий

Директор по информационным технологиям из $5B финансовой компании выразил это так:

“Мы сейчас оцениваем пять разных GenAI решений. Но та система, которая лучше всего учится и адаптируется к нашим специфическим процессам – в итоге выиграет наш бизнес. Как только мы вложили время в обучение системы под наши рабочие процессы, затраты на переход становятся запретительными.”

Практические выводы: что делать менеджеру

Итак, вы видите разрыв. Вы понимаете, что 95% компаний застряли на неправильной стороне. Что конкретно делать, чтобы не повторить их ошибки?

Если вы выбираете AI-инструменты

Не покупайте универсальные решения для критических процессов. ChatGPT отлично работает для разовых задач, но провалится в критически важных процессах без памяти и адаптивности.

Спрашивайте про возможности обучения. Как система сохраняет контекст? Учится ли она на исправлениях? Адаптируется ли к изменениям в ваших процессах?

Требуйте кастомизацию. Лучшие поставщики не продают готовые продукты с полки. Они работают как консультанты – глубоко погружаются в ваши процессы, настраивают под ваши критерии, интегрируются в ваши системы.

Начинайте с административных функций, а не клиентских. Да, продажи и маркетинг – заметные победы. Но максимальная отдача часто в юридической автоматизации, закупках, финансах.

Если вы внедряете AI

Покупайте, а не разрабатывайте. Если у вас нет сильной внутренней команды AI с экспертизой в предметной области – стратегические партнёрства покажут результаты в 2 раза лучше.

Децентрализуйте полномочия, но не ответственность. Дайте владельцам бюджетов и доменным менеджерам возможность выявлять проблемы, проверять инструменты, руководить внедрением. Но держите ответственность руководителей за результаты.

Оценивайте по бизнес-метрикам, а не техническим. Не точность модели. Не время отклика. А реальную экономию затрат, сокращение времени, снижение ошибок.

Ищите опытных пользователей как первых энтузиастов. Многие из лучших корпоративных внедрений начались с сотрудников, которые уже экспериментировали с ChatGPT или Claude для личной продуктивности. Они понимают возможности и ограничения AI интуитивно.

Чего избегать

Не запускайте «AI в диких условиях» – простое разрешение ChatGPT без методики приводит к теневой AI-экономике и нулевой корпоративной ценности.

Не гонитесь за эффектными демонстрациями – знание предметной области и интеграция в рабочие процессы важнее красивого интерфейса.

Не ждите сокращения штата – реальная отдача приходит от отказа от аутсорсинга, сокращения затрат на агентства, оптимизации внешних издержек. Не от увольнений.

Не игнорируйте Learning Gap – если система не может учиться, адаптироваться, запоминать – она не пересечёт GenAI Divide, как бы хороша ни была модель.

Что даёт курс mysummit.school в контексте GenAI Divide

Исследование MIT показывает: главный барьер для преодоления разрыва – не отсутствие технологий, а отсутствие методики применения. Те же самые инструменты дают противоположные результаты в зависимости от подхода.

Курс mysummit.school построен именно на этом принципе. Не продажа коллекций промптов. Не абстрактная теория про «что такое LLM». А практическая методика применения AI-инструментов в реальных бизнес-процессах.

Модуль 1: Анализ рабочего контекста

Прежде чем внедрять AI, нужно понять ваши конкретные процессы. Какие задачи повторяющиеся? Где узкие места? Что можно автоматизировать без потери качества?

Это именно то, что делают компании на правильной стороне GenAI Divide – они начинают не с инструментов, а с глубокого понимания своих рабочих процессов.

Результат модуля: портрет работы вашего бизнеса или отдела, с чёткой картой, где AI может дать максимальный эффект.

Модуль 2: План применения AI

60% организаций оценивали корпоративные AI-инструменты. До пилота дошли 20%. До промышленной эксплуатации – 5%. Почему? Потому что пилоты запускают без стратегического плана.

В этом модуле – как создавать дорожную карту внедрения AI, которая учитывает:

  • Технологические возможности разных инструментов (YandexGPT vs ChatGPT vs Claude)
  • Ограничения вашей организации (конфиденциальность данных, соответствие требованиям, интеграция)
  • Реалистичные сроки и контрольные точки
  • Фреймворк принятия решения: разрабатывать или покупать

Результат модуля: пошаговый план внедрения AI в работу бизнеса или отдела, который не застрянет в ловушке пилотных проектов.

Модуль 3: Применение AI-инструментов

Здесь начинается настоящая работа. Промптинг – не просто «написать хороший промпт», а калибровка под ваши специфические задачи. Векторный поиск для RAG-систем. Дообучение моделей. AI-агенты с постоянной памятью.

Это именно те возможности, которые отличают универсальный ChatGPT (хорош для писем) от систем корпоративного уровня (работают для критических процессов).

Результат модуля: практические навыки работы с AI-инструментами на уровне, который позволяет извлекать реальную бизнес-ценность, а не просто впечатляющие демонстрации.

Модуль 4: Итоговая работа с обратной связью

Исследование MIT подчёркивает: способность к обучению – ключевой фактор успеха. Не только в AI-системах, но и в людях, которые их внедряют.

Итоговая работа – это не тест. Это реальный проект внедрения AI в ваш процесс, с экспертной оценкой и обратной связью. Именно так компании на правильной стороне GenAI Divide подходят к внедрению – как к итеративному процессу обучения, а не разовому запуску.

Результат модуля: готовый артефакт (внедрённая AI-система) + обратная связь от экспертов по улучшению.

Бесплатный модуль

Пересеките GenAI Divide с методикой, а не хайпом

Практический курс для менеджеров: анализ процессов, выбор инструментов, правильное внедрение AI с измеримым ROI. От практиков, которые уже преодолели разрыв.

Детальный разбор инструментов с примерами
Готовые промпты для типовых задач
Навыки безопасного использования AI
Понимание, как измерять ROI
Начать обучение →
Без платёжных данных

Credibility check: можно ли доверять этому исследованию?

Когда видишь такие драматичные цифры – «95% получают ноль ROI» – первый вопрос: а откуда данные?

Исследование MIT NANDA (Networked Agents And Decentralized Architecture) – это не один человек с опросом в LinkedIn. Это:

  • 300+ публичных AI-инициатив – систематический обзор
  • 52 организации – структурированные интервью с представителями
  • 153 топ-менеджера – ответы на опросы, собранные на четырёх крупных отраслевых конференциях

Период исследования: январь–июнь 2025 Авторы: Aditya Challapally, Chris Pease, Ramesh Raskar (MIT Media Lab), Pradyumna Chari Рецензент: Pradyumna Chari, Project NANDA

Методология прозрачная. Все специфичные для компаний данные анонимизированы для соблюдения требований. Мнения выражены исключительно авторами, а не аффилированными работодателями. Это стандарт для академических исследований – показывает, что нет коммерческого интереса искажать результаты.

Но есть ограничения

Авторы сами признают ограничения – это всегда хороший знак:

Ограничения выборки:

  • Выборка может не представлять все корпоративные сегменты или географические регионы
  • Организации, готовые обсуждать проблемы с AI, могут систематически отличаться от тех, кто отказался от участия
  • Метрики успеха значительно различаются между организациями

Методологические ограничения:

  • Оценки отраслевых изменений отражают публично наблюдаемые паттерны – могут не захватывать приватные разработки
  • Процентные соотношения разработки и покупки основаны на ответах интервью, а не всеобъемлющих рыночных данных
  • 6-месячный период наблюдения может быть недостаточен для полной оценки «успешного внедрения» сложных корпоративных систем

Внешние факторы, не полностью учтённые:

  • Регуляторные ограничения
  • Культурные различия между регионами

Значит ли это, что исследование ничего не доказывает? Нет. Это означает, что мы видим выводы, верные в общем направлении, а не абсолютную истину, высеченную в камне.

95% провалов – это не «95,00% с точностью до сотых». Это «подавляющее большинство компаний не получают измеримой бизнес-ценности из корпоративных AI-инвестиций». И это согласуется с тем, что мы видим в реальных компаниях.

Выводы: окно возможностей закрывается

GenAI Divide – это не постоянный разрыв. Это временная ситуация, которая разделяет первопроходцев от отстающих. Но окно для преодоления разрыва быстро закрывается.

Исследование показывает: корпорации начинают закреплять отношения с поставщиками через системы с возможностью обучения. Как только организация вложила месяцы в обучение AI под свои рабочие процессы, затраты на переход становятся запретительными.

Директора по информационным технологиям и руководители закупок оценивают это окно в 18 месяцев. Те компании, которые сейчас инвестируют в AI-системы, которые учатся на их данных, процессах, обратной связи – создают затраты на переход, которые растут каждый месяц.

Три ключевых инсайта для действия

Первый – проблема не в технологиях. ChatGPT, Claude, YandexGPT – все достаточно мощные. Проблема в отсутствии методики применения. Те же инструменты дают противоположные результаты в зависимости от подхода.

Второй – Learning Gap критичен. Системы без памяти, адаптивности, непрерывного обучения застрянут в пилотной стадии навсегда. Реальная бизнес-ценность приходит от агентских систем, которые эволюционируют вместе с вашими процессами.

Третий – разработка проигрывает покупке в 2 раза чаще. Если у вас нет исключительной внутренней команды AI – стратегические партнёрства дадут лучшие результаты. Экспертиза в предметной области + ответственность за бизнес-метрики > эффектные внутренние проекты-любимчики.

Что делать прямо сейчас

Если вы на неправильной стороне GenAI Divide:

  1. Аудит текущих AI-инициатив – сколько пилотов? Сколько в промышленной эксплуатации? Какая измеримая отдача?
  2. Анализ Learning Gap – ваши системы учатся на обратной связи? Адаптируются к процессам? Или статичны?
  3. Решение: разрабатывать или покупать – честно оцените внутренние возможности. Может, стратегическое партнёрство даст результаты в 2 раза лучше?
  4. Начните с административных функций – не гонитесь за заметными победами в продажах/маркетинге. Максимальная отдача часто в юридических, закупках, финансах.

Если вы ещё не начали:

  1. Не покупайте хайп – универсальные AI-инструменты для видимости не преодолеют разрыв.
  2. Начните с методики – поймите ваши процессы перед выбором инструментов.
  3. Ищите поставщиков с возможностью обучения – спрашивайте про память, адаптацию, непрерывное обучение.
  4. Требуйте кастомизацию – готовые продукты с полки для критических процессов = путь к 95% провалов.

GenAI Divide – это не технологический разрыв. Это методологический разрыв. Компании, которые это понимают и действуют сейчас, окажутся на правильной стороне через 18 месяцев. Остальные будут рассказывать про пилоты, которые так и не дошли до промышленной эксплуатации.


Источники и дополнительные материалы

Основное исследование:

  1. MIT NANDA – State of AI in Business 2025 Report Aditya Challapally, Chris Pease, Ramesh Raskar, Pradyumna Chari (July 2025) 📄 Полный отчёт (PDF, 26 стр.)

Ключевые концепции:

  • Разрыв в генеративном ИИ (The GenAI Divide): разрыв между высоким внедрением (80%+) и низкой трансформацией (только 5% достигают промышленной эксплуатации)
  • Разрыв в обучаемости (Learning Gap): отсутствие памяти, адаптивности, непрерывного обучения в большинстве корпоративных AI-систем
  • Теневая AI-экономика: 90% сотрудников используют личные AI-инструменты, при том что только 40% компаний купили корпоративные подписки
  • Агентский AI: системы с постоянной памятью и итеративным обучением, которые могут пересечь разрыв в генеративном ИИ
  • Model Context Protocol (MCP), Agent-to-Agent (A2A), NANDA: фреймворки для взаимодействия агентов и будущего агентского веба

Методология исследования:

  • 300+ публичных AI-инициатив (систематический обзор)
  • 52 организации (структурированные интервью)
  • 153 топ-менеджера (ответы на опросы на 4 крупных отраслевых конференциях)
  • Период исследования: январь–июнь 2025