Почему ИИ-пилоты на заводе умирают между демо и цехом

9 мин чтения
Stanislav Belyaev
Stanislav Belyaev Engineering Leader в Microsoft
Почему ИИ-пилоты на заводе умирают между демо и цехом

Пилот показали на совете директоров, все похлопали, выделили бюджет на «масштабирование». Через полгода система компьютерного зрения, которая на демо ловила 98% дефектов, ловит хорошо если половину, контролёры ОТК перестали ей доверять, а проект тихо переехал в раздел «отложенных инициатив». Это не редкий сбой и не вина конкретного интегратора. По данным RAND, так заканчивается больше 80% корпоративных ИИ-проектов – и почти всегда по причинам, которые видно было ещё до старта.

Самое неприятное в этой статистике – не сам процент провалов, а то, что виновата в них почти никогда не технология. Корпорация RAND в исследовании 2024 года опросила 65 дата-сайентистов и инженеров с опытом от 5 до 30 лет и разобрала причины, по которым ИИ-проекты не доходят до продакшена. Вывод звучит почти обидно: самая частая причина провала – в том, что руководители и технические специалисты по-разному поняли, какую задачу вообще нужно решить. Не данные, не модель, не GPU. Постановка задачи.

Для производственного руководителя это хорошая новость. Если бы дело было в технологии, оставалось бы только ждать следующего поколения моделей. Но раз дело в управленческих решениях – значит, на исход можно влиять. Ниже – семь признаков, что пилот обречён, собранные из RAND, McKinsey и разборов провалов в автопроме. Каждый признак – это вопрос, который стоит задать команде до того, как вы подпишете бюджет на масштабирование.

Сначала о масштабе: почему «пилот удался» ничего не значит

Завести пилот сегодня несложно. Сложно довести его до состояния, когда им ежедневно пользуются на трёх сменах и он влияет на цифры в P&L. Разрыв между этими двумя точками – главная ловушка.

McKinsey в отчёте 2025 года о масштабировании ИИ в производстве приводит цифру, которая отрезвляет: только 2% производителей считают, что ИИ полностью встроен в их операции. Около двух третей застряли на стадии исследования и точечных внедрений – то есть на бесконечных пилотах. Похожую картину рисует отчёт MIT, о котором мы писали отдельно: у 95% компаний генеративный ИИ не дал измеримого эффекта на прибыль.

В автопроме это видно в чистом виде. По разборам отраслевого издания Automotive Manufacturing Solutions, большинство проектов компьютерного зрения для контроля качества так и не выходят за пределы тестовой ячейки – не потому, что плохо распознают дефекты на демо, а потому, что демо и реальный цех – это две разные среды.

Дальше – по признакам.

Признак 1. Никто не может назвать цену проблемы в рублях

RAND ставит непонимание задачи на первое место среди причин провала, и в производстве оно проявляется специфически. Пилот запускают, потому что «надо внедрять ИИ» или потому что конкурент похвастался на конференции. Сформулировать, какую именно потерю в деньгах закрывает проект, никто не может.

McKinsey фиксирует ту же болезнь количественно: у большинства производителей нет привязки ИИ-инициатив к конкретным целевым показателям ценности. Проект без цены проблемы невозможно ни приоритизировать, ни закрыть, ни признать успешным – у него просто нет критерия. Как строить такой бизнес-кейс с реальными данными, мы разбирали отдельно.

До старта пилота попробуйте заполнить одну строку: «эта задача стоит нам N рублей в месяц, потому что …». Если N посчитать не получается – это не значит, что задача плохая. Это значит, что вы пока не понимаете её достаточно, чтобы тратить на неё ИИ-бюджет. Возьмите ту, где N очевиден: простой линии, переделка брака, штраф за срыв поставки.

Цену проблемы считать сложнее, чем кажется. Попробуйте ИИ на 9 реальных задачах руководителя – от анализа данных до претензии поставщику – бесплатно и без регистрации.

Доступ сразу после регистрации

Начать обучение

Признак 2. Данных для задачи на самом деле нет

Вторая по частоте причина в списке RAND – у организации нет нужных данных. На заводе это звучит особенно знакомо. Данные вроде бы есть: SCADA пишет телеметрию, MES хранит наряды, ОТК ведёт журналы. Но когда доходит до обучения или промптинга модели, выясняется, что половина журналов на бумаге, в SCADA нет истории отказов с разметкой, а описания дефектов каждый контролёр пишет своими словами.

Это та самая фрагментация данных, на которую жалуются в автопроме: данные есть, но они разбросаны по системам, не размечены и не сведены к единому формату. Модель, обученная на чистой выборке для демо, в продакшене встречает реальность – и проседает.

Прежде чем заказывать пилот, стоит провести честную ревизию: где лежат данные по задаче, в каком они формате, кто их вносит и насколько единообразно. Если на этом этапе становится неуютно – лучше сначала навести порядок в данных, а уже потом запускать ИИ. Бумажный слой, с которого мы советовали начинать, хорош именно тем, что не требует чистой исторической выборки – модель работает с тем, что вы даёте ей прямо сейчас.

Признак 3. Команда влюблена в технологию, а не в проблему

Третья причина у RAND сформулирована прямо: проект больше увлечён применением самой свежей технологии, чем решением реальной проблемы. На производстве это выглядит как стремление сразу строить компьютерное зрение с дообучением нейросети там, где задачу решал бы простой текстовый ассистент за неделю.

MIT в своём отчёте отмечает смежный перекос: больше половины бюджетов на генеративный ИИ уходит в эффектные витрины – продажи и маркетинг, – тогда как наибольшую отдачу даёт скучный бэк-офис. На заводе аналог витрины – «умный цех» для экскурсий инвесторов; аналог бэк-офиса – автоматизация сменной отчётности и претензионной работы, которая никого не впечатлит на совете директоров, но реально экономит часы.

Один проверочный вопрос инициатору пилота: «Если бы этой технологии не существовало, как бы мы решали эту проблему?» Если внятного ответа нет – решение придумали раньше проблемы. Разворачивайте разговор от модели к задаче.

Признак 4. Задача в принципе не по зубам нынешнему ИИ

Пятая причина в списке RAND – ИИ применяют к задачам, которые слишком сложны для него. Это не приговор технологии, а вопрос границ. ИИ хорошо структурирует текст, распознаёт типовые дефекты, подбирает аналоги деталей. Он плохо справляется там, где нужны редкие события без истории, физические рассуждения о незнакомом оборудовании или решения с ценой ошибки в человеческую жизнь без страхующего контура.

Полезно разделить задачи на три корзины: «ИИ делает сам», «ИИ готовит черновик, человек утверждает», «ИИ пока не трогаем». Большинство производственных задач честно попадают в среднюю корзину – и это нормально. Проблемы начинаются, когда задачу из третьей корзины пытаются затащить в первую под давлением сроков.

Три корзины задач для ИИ: «делает сам», «готовит черновик», «пока не трогаем»

Где ИИ помогает, а где незаметно ошибается – видно только на практике. В открытом модуле 9 задач менеджера с разбором типичных ошибок, бесплатно.

Доступ сразу после регистрации

Начать обучение

Признак 5. Дрейф, о котором забывают через полгода

Это специфически производственная ловушка, которую офисные внедрения почти не знают. Модель компьютерного зрения, отлично работавшая на запуске, через несколько месяцев начинает ошибаться – и не потому, что её сломали. Изменилось освещение в цехе, поставщик сменил марку стали с чуть другим отблеском, износилась камера, сезон поменял влажность. Модель осталась прежней, а мир вокруг неё уехал.

Дрейф модели: точность падает с 98% на демо до ≈50% через полгода после запуска

Разбор этого эффекта в автопроме показывает закономерность: инспекционные системы деградируют не сразу, а спустя месяцы после успешного пилота, когда команду внедрения уже распустили, а про переобучение модели никто не подумал. Пилот, у которого нет плана на жизнь после запуска, обречён независимо от качества старта.

В проект стоит заложить не только запуск, но и эксплуатацию: кто и как часто проверяет точность, по какому порогу запускается переобучение, кто за это отвечает. Если ответ – «команда внедрения уйдёт, а дальше посмотрим», вы оплачиваете пилот, который умрёт по расписанию.

Признак 6. Всё держится на двух-трёх специалистах

Четвёртая причина у RAND – нехватка инфраструктуры для управления данными и развёртывания моделей. На практике это часто маскируется под кадровую зависимость: пилот работает, потому что его на коленке держат два энтузиаста-инженера. Они ушли в отпуск, сменили работу или переключились на другой проект – и система встала, потому что инфраструктуры, которая жила бы без них, нет.

Проверьте, переживёт ли проект уход любого одного человека. Если ответ «нет» – у вас не внедрённая система, а демо, которое случайно дожило до продакшена. До масштабирования нужна минимальная инфраструктура: документированный процесс, доступы, мониторинг, регламент обновления.

Признак 7. У проекта нет владельца со стороны бизнеса

Это сквозная причина, которая связывает все предыдущие. RAND и BCG сходятся в одном: у успешных проектов есть владелец продукта со стороны бизнеса – человек, который отвечает за результат в деньгах, а не за то, что «модель обучилась». Для IT- и продуктовых менеджеров, которые строят такой же процесс внутри команды, закономерность та же. Когда пилот целиком на ИТ или на внешнем интеграторе, некому ни поставить задачу в терминах цеха, ни принять решение об остановке, ни добиться, чтобы цехом реально пользовались.

BCG описывает рабочую пропорцию усилий внедрения как 70/20/10: семьдесят процентов сил уходит на людей, процессы и изменение того, как работает цех, двадцать – на технологии и данные, и лишь десять – на алгоритмы. Если в вашем проекте всё наоборот и 90% бюджета – это лицензии и интеграция, перекос виден сразу.

Владельца со стороны производства нужно назначать до старта, а не после. У него должны быть полномочия остановить проект – и мотивация довести его до ежедневного использования.

Как это собрать в один чек-лист

Перед тем как подписать бюджет на масштабирование пилота, пройдите по семи вопросам. Каждое «нет» – это не повод отказаться от ИИ, а место, где проект сломается, если не починить заранее.

  • Можем ли мы назвать цену проблемы в рублях?
  • Есть ли у нас данные для этой задачи в пригодном виде?
  • Решаем ли мы проблему, а не любуемся технологией?
  • По силам ли эта задача нынешнему ИИ?
  • Есть ли план на жизнь системы после запуска, с учётом дрейфа?
  • Переживёт ли проект уход любого одного человека?
  • Есть ли владелец со стороны бизнеса с правом остановить проект?

Закономерность RAND читается между строк этого списка: шесть из семи вопросов – про управление, и только один – про технологию. Завод, который умеет отвечать «да» на управленческие вопросы, доведёт до цеха даже скромную модель. Завод, который надеется, что всё вытянет технология, провалит и самую сильную.

И вот что обнадёживает на фоне мрачной статистики. Навык формулировать задачу, считать её цену и отделять «по силам ИИ» от «не по силам» – это не врождённый талант и не редкое умение дорогого консультанта. Это тренируемая управленческая дисциплина. Проще всего она ставится не на дорогом провальном пилоте, а на безопасных учебных задачах, где ошибку видно сразу и она ничего не стоит.

Специализация

От чек-листа к системному навыку

Открытый модуль mysummit.school: 9 практических задач, на которых видно, где ИИ реально помогает, а где незаметно ошибается. Фундамент курса даёт навыки формулирования задач, оценки результата и управления рисками ИИ – то, что отделяет удачный пилот от вечно отложенного. Бесплатно, без регистрации.

От pre-mortem до антикризисного плана
Переиспользуемые промпт-шаблоны
Сквозной кейс на реальном проекте
~300 часов экономии в год

Часто задаваемые вопросы

Почему большинство ИИ-пилотов не выходят за пределы тестовой ячейки?
По данным RAND (2024), главная причина – не технология, а расхождение между тем, что руководство считает целью проекта, и тем, что понимают технические специалисты. Демо строится под показ, продакшен – под ежедневную работу в три смены. Эти два режима требуют разного.
Что такое дрейф модели и почему он убивает ИИ-внедрения на производстве?
Дрейф модели – постепенное ухудшение точности из-за изменений в среде: другое освещение, новая партия металла, замена камеры, сезонная влажность. Модель обучалась на данных запуска; реальный цех медленно от них уходит. Деградация незаметна месяцами – и обнаруживается, когда команду внедрения уже распустили.
Как понять, что ИИ-задача по силам нынешним моделям?
Ориентир простой: ИИ хорошо работает с типовыми паттернами и текстом, хуже – с редкими событиями без истории и физическими рассуждениями о незнакомом оборудовании. Разделите задачи на три корзины: «ИИ делает сам», «ИИ готовит черновик», «ИИ пока не трогаем» – большинство производственных задач честно попадут в среднюю.
Почему BCG рекомендует тратить 70% усилий ИИ-проекта на людей, а не на технологию?
Потому что технология – это только условие. Если операторы не доверяют системе, менеджер не проверяет её точность, а регламент обновления не написан, модель деградирует или её перестают использовать. BCG назвал это правилом 70/20/10: 70% – люди и процессы, 20% – данные и технологии, 10% – алгоритмы.
Кто должен быть владельцем ИИ-проекта на производстве?
Человек со стороны бизнеса, у которого есть полномочия остановить проект и мотивация довести его до ежедневного использования. Не IT-директор и не внешний интегратор – они отвечают за то, что «модель работает», а не за то, что цех ею пользуется каждую смену.
Stanislav Belyaev

Stanislav Belyaev

Engineering Leader в Microsoft

18 лет в управлении инженерными командами. Основатель mysummit.school. 700+ выпускников в Яндекс Практикуме и Стратоплане.