"Как включить AI-затраты в договор с IT-подрядчиком?"

"Три проверенных модели: прямая передача затрат на токены с наценкой 10–20% (для T\u0026M-проектов), пакетирование в фиксированную цену (для Fixed Price), гибрид с базовым пакетом токенов и оплатой превышения (для крупных проектов). Договор должен включать таксономию AI-затрат, бюджет токенов, право маршрутизации моделей и механизм пересмотра ставок."

"Что такое fair use allowance в AI-контрактах?"

"Fair use allowance (базовый лимит использования) – гибридная модель, при которой определённый пакет токенов включён в стоимость проекта, а превышение оплачивается отдельно по согласованной ставке. Эту модель используют Big 4, Accenture и BCG. Размер базы обычно рассчитывается как базовый сценарий потребления + 15%."

"Как работает маршрутизация моделей в консалтинговых проектах?"

"Подрядчик использует дорогие модели (DeepSeek V4 Pro, Kimi K2.6) для сложных аналитических задач, а дешёвые (Qwen 3.6 Flash, DeepSeek V4 Flash) – для черновиков и рутины. Это даёт экономию 40–70%. Право на маршрутизацию должно быть явно прописано в договоре, иначе подрядчик формально обязан согласовывать каждую замену модели."

"Какие риски AI-контрактов специфичны для России?"

"Три ключевых: валютный контроль (платежи за иностранные API через рублёвые счета типа 'С', обязательная продажа 80% валютной выручки), налоговые стимулы использовать отечественный AI (двукратный коэффициент вычета для YandexGPT/GigaChat vs 1x для OpenAI), и ожидаемый закон об ИИ, который может классифицировать иностранные AI-сервисы как трансграничные технологии."

Токены в договоре: кто платит за ИИ в IT-консалтинге | mysummit.school

Q: "Сколько стоит типичный AI-контракт у Big 4?"

"По оценкам отрасли, типичный AI-контракт у Big 4 начинается от $500 000. При этом доля AI-затрат в IT-проектах уже составляет 5–15% от общего бюджета, а около 85% организаций ошибаются в прогнозе AI-затрат более чем на 10%."

Клиент смотрит в счёт и видит строку «AI API usage – $3 200». Вопрос немедленный: «Это что вообще такое?» Консультант объясняет: токены, запросы к Claude API, стоимость инференса. Клиент кивает и уходит разбираться с финансовым директором. Через неделю юрист присылает письмо: «В договоре такой статьи расходов нет».

Именно так начинается большинство конфликтов вокруг AI-затрат в IT-консалтинге. Договор писался до того, как токены стали реальными деньгами – и ни одна из сторон не подумала зафиксировать эту статью расходов.

В моей практике я видел этот сценарий трижды за последний год – каждый раз в проектах, где техническая команда внедрила AI-инструменты быстрее, чем контрактный отдел успел обновить договор. По данным исследования Benchmarkit и Mavvrik (2025), около 85% организаций ошибаются в прогнозе AI-затрат более чем на 10%, а каждый четвёртый проект превышает запланированный AI-бюджет больше чем вполовину. При этом доля AI-затрат в IT-проектах уже составляет 5–15% от общего бюджета – цифра, которую больше нельзя прятать в «операционные расходы подрядчика». Реальная стоимость AI-инструментов для команды – от $20 до $400 в месяц на человека, и это только прямые расходы.

Три модели, которые сложились на практике

За 2024–2026 годы рынок IT-консалтинга выработал три устойчивые схемы учёта AI-затрат. Они не продиктованы теорией контрактного права – они выросли из практики, конфликтов и переговоров.

Модель 1: Прямая передача затрат (pass-through) – прозрачность ценой сложности

Клиент платит фактические затраты на токены плюс наценку подрядчика (обычно 10–20%). Luxoft (DXC) используют именно эту схему: клиент получает доступ к панели потребления токенов в реальном времени, видит разбивку по моделям, задачам и пользователям.

Привлекательность очевидна: никакой скрытой маржи, полная прослеживаемость, возможность оптимизировать расходы на стороне клиента. Проблема в другом – такая модель порождает постоянный разговор о деньгах там, где раньше разговора не было. Клиентский финансовый директор получает дополнительную переменную статью расходов, которую нужно объяснять на каждом квартальном совещании.

Эта схема хорошо работает в Time & Materials-проектах, где заказчик и так принимает переменность затрат как данность.

Модель 2: Пакетирование (бандлинг) – простота ценой риска

EPAM и часть Softline работают иначе: AI-затраты входят в фиксированную ставку или фиксированный бюджет проекта. EPAM позиционирует это через платформу AI/RUN – пакет инструментов, который консультант приносит с собой.

Клиенту это понятно: одна строка в договоре, предсказуемый счёт. Подрядчику – рискованно: если потребление токенов оказалось выше расчётного, маржа съедается. Если ниже – подрядчик зарабатывает на неиспользованном ресурсе, что создаёт странный стимул использовать AI меньше, а не больше.

На практике EPAM решает это через агрессивное кэширование промежуточных результатов и маршрутизацию дешёвых моделей на рутинные задачи. Softline идёт ещё дальше – автоматические предохранители (circuit breakers), которые переключают задачу на более дешёвую модель, если стоимость запроса превышает порог.

Работает на Fixed Price-контрактах, где предсказуемость важнее прозрачности.

Модель 3: Гибрид – доминирует у крупных игроков

Big 4, Accenture, BCG используют схему, которую на практике называют «базовый лимит использования» (fair use allowance): базовый пакет токенов включён в стоимость проекта, превышение оплачивается отдельно по согласованной ставке. По оценкам отрасли, типичный AI-контракт у Big 4 начинается от $500 000.

Это стало доминирующей моделью на корпоративном рынке не случайно – и это ложится в логику обоснования AI-затрат перед бизнесом. Она решает главную проблему двух предыдущих: клиент понимает, что входит в базу, а подрядчик защищён от неожиданного перерасхода. При этом у обеих сторон есть стимул эффективно расходовать ресурс – клиент платит за превышение, подрядчик несёт издержки при неэффективном потреблении внутри базы.

Параметры гибридной модели, которые нужно согласовывать в договоре:

размер базового пакета (обычно рассчитывается на основе сценарного бюджетирования – подробнее ниже)
ставка за превышение
механизм контроля (кто и как мониторит потребление)
частота сверки (reconciliation) – ежемесячно, поквартально?

Сценарное бюджетирование: как считать базу

Любая из трёх моделей требует отправной точки – прогноза потребления токенов. Хорошая практика – три сценария.

Первый – базовый: если всё пойдёт как обычно, сколько запросов, к каким моделям, какой средний размер контекста? Это ваша точка отсчёта и основа для расчёта базового пакета в гибридной модели.

Второй – гарантированный объём (committed-use): то, что вы готовы гарантировать как минимум. Если у проекта есть объёмные соглашения с AI-провайдером (скидки за гарантированный объём потребления), этот уровень должен быть покрыт проектом в любом случае.

Третий – стресс-сценарий. Что если объём данных окажется втрое больше расчётного? Или клиент захочет добавить ещё два сценария применения в середине проекта? Буфер 10–15% от базового сценария покрывает незапланированные итерации. Буфер 30–40% нужен при высокой неопределённости задачи – типичная ситуация для ранних стадий проекта, где объём работ ещё не устоялся.

В контексте резкого падения стоимости инференса – в 280 раз за два года по данным Stanford AI Index – есть ещё один аргумент для прозрачного учёта токенов: стоимость одного и того же набора задач через год может быть существенно ниже. Если в договоре зафиксирована фиксированная ставка без механизма пересмотра, клиент рискует переплачивать за подешевевший ресурс.

Именно поэтому разумный договор содержит положение о пересмотре базовой ставки при изменении рыночной стоимости AI-сервисов более чем на X% за период.

Сценарное бюджетирование выглядит логично на схеме – сложность начинается, когда нужно применить его к живому проекту с реальными данными и клиентом, который задаёт вопросы. Разница между «примерно посчитали» и «посчитали с обоснованием» – это навык, который не приходит из чтения инструкций.

Считать бюджет токенов – одна из задач менеджера с ИИ. В открытом модуле – 9 практических задач: попробуйте ИИ на реальных рабочих сценариях бесплатно, без регистрации.

Доступ сразу после регистрации

Начать обучение

Что должно быть в договоре: семь положений

Сколько из этих пунктов есть в вашем текущем договоре с IT-подрядчиком? Практика работающих договоров выкристаллизовала набор положений, которые закрывают большинство конфликтных ситуаций.

Без таксономии AI-затрат ничего остальное не работает. Отдельная строка для каждого типа: обучение и файн-тюнинг, инференс (токены), подготовка данных, инфраструктура, управление изменениями. Без этой детализации «AI costs» в счёте – черный ящик, из которого вылезают споры.

Следующее положение – бюджет токенов с механизмом превышения: базовая аллокация и ставка за превышение. Формула ставки должна быть привязана к рыночным ценам провайдеров, а не зафиксирована навсегда. Стоимость инференса падает – значит, договор должен это учитывать.

Отдельно стоит зафиксировать право маршрутизации моделей. Подрядчик вправе использовать более дешёвые модели для рутинных задач без уведомления клиента, если качество результата остаётся в пределах согласованных метрик. Именно маршрутизация – Kimi K2.6 или DeepSeek V4 Pro для сложных задач, Qwen 3.6 Flash или DeepSeek V4 Flash для черновиков – даёт 40–70% экономии по сравнению с использованием одной флагманской модели. Без этого права в договоре подрядчик формально обязан согласовывать каждую замену.

Остальные четыре положения более стандартны, но не менее важны. Метрики результата: стоимость за результат вместо стоимости за токен – «стоимость подготовки одного статус-отчёта» понятна бизнесу, «$0,014 за тысячу токенов» – нет. Уведомление о смене модели – за 30 дней до материальной замены AI-модели в продакшне, потому что смена модели меняет поведение системы. Конфиденциальность данных: явно указать, какие данные, в какое облако, под какие гарантии, на какой срок – критично для российского контекста. И наконец, IP-права на AI-выходы: кому принадлежат fine-tuned модели, промпты, производные датасеты – по умолчанию это серая зона.

Регуляторный ландшафт СНГ для AI-контрактов

Правовой контекст СНГ: не про деньги, а про регуляторику

Стандартный разговор про AI-биллинг в Европе или США – это разговор про финансы. В СНГ добавляется слой, который важнее: регуляторный риск. Игнорировать его в договоре – ошибка.

Россия: самый сложный контекст

Гражданский кодекс (ст. 421) позволяет структурировать прямую передачу API-затрат несколькими способами: как материалы в договоре подряда (подрядные материалы), как расходы субподрядчика или как часть цены услуги. Каждый вариант имеет разные налоговые и НДС-последствия, и это нужно согласовывать с бухгалтерией, а не решать самостоятельно.

С января 2025 года действует двукратный коэффициент налогового вычета на расходы по отечественному AI-программному обеспечению (Федеральный закон 176-ФЗ). Иностранный AI получает стандартный коэффициент 1x. На практике это означает финансовый стимул использовать YandexGPT или GigaChat вместо OpenAI – и это нужно учитывать при выборе стека и формулировке договора.

Но главный риск в России – валютный контроль. Платежи за API-сервисы OpenAI, Anthropic и других американских или европейских провайдеров должны проходить через рублёвые счета типа «С». 80% валютной выручки подлежит обязательной продаже. Авансовые платежи нерезидентам ограничены 30%. На практике это означает, что обещать клиенту «доступ к Claude API» в российском проекте – значит принять на себя регуляторный риск, который может реализоваться в середине проекта.

Ожидаемый законопроект об ИИ (принятие анонсировано на сентябрь 2027 года) классифицирует иностранные AI-сервисы как «трансграничные AI-технологии». Если данные уходят за рубеж – это потенциально запрещённая операция. Формулировки ещё прорабатываются, но консервативная позиция выглядит так: в новых контрактах с российскими клиентами не гарантировать доступ к иностранным AI-API, строить архитектуру на отечественных или self-hosted решениях.

Суды при этом всё чаще рассматривают споры по российскому праву вместо международного арбитража – даже если договор предусматривал иное (так называемый «Закон Лугового», ст. 248.1–248.2 АПК РФ). Для IT-консалтинга это значит: международная арбитражная оговорка в договоре с российским контрагентом защищает хуже, чем принято считать.

Казахстан: наиболее структурированная среда

С 18 января 2026 года в Казахстане действует специальный закон об ИИ – первый подобный документ в СНГ. Закон явно возлагает ответственность за AI-выходы на разработчика, владельца или пользователя системы. Для IT-консалтинга это означает необходимость явно определять в договоре, кто несёт ответственность за качество AI-генерируемого контента: подрядчик или клиент?

Казахстанский закон также признаёт авторские права на «творчески сформулированные AI-промпты» – прецедент, которого пока нет в российском законодательстве. Это создаёт возможность для подрядчика защитить свои промпт-библиотеки как ИС.

Налоговый контекст в Казахстане добавляет сложность: 20% налог у источника (withholding tax) на платежи нерезидентам за услуги. Если ваш AI-провайдер – иностранная компания без казахстанского юрлица, этот налог ложится на покупателя услуги.

Беларусь и Узбекистан: крайние точки спектра

Беларусь близка к России по валютному контролю и технологическому суверенитету – в первую очередь по практике, а не по формальным нормам. Специального AI-законодательства нет, вероятно будет следовать российскому вектору. При этом большая гибкость в выборе применимого права для договоров с нерезидентами даёт больше степеней свободы в структурировании.

Узбекистан – другой полюс. Никакого специального AI-законодательства, общее контрактное право, наиболее открытый валютный режим для платежей иностранным API-провайдерам. Растущий IT-аутсорсинговый хаб (свыше 100 тыс. занятых в секторе, около 12% годового роста). Для проектов, где важен доступ к западным AI-сервисам без ограничений, Узбекистан – наименее рискованная юрисдикция в СНГ.

Контракты – это рамка. Реальная работа с ИИ начинается внутри неё. Попробуйте ИИ на 9 задачах менеджера – бесплатный открытый модуль, без регистрации.

Доступ сразу после регистрации

Начать обучение

Конкретные рекомендации по структуре договора

На основе трёх моделей и правового контекста можно сформулировать практические ориентиры.

Fixed Price проект

AI-затраты закладываются в фиксированную цену с буфером 15–20% от сценарного расчёта. Договор содержит положение об изменении объёма работ: если клиент добавляет новые сценарии применения AI, это фиксируется как запрос на изменение с дополнительным бюджетом. Явно прописывается право подрядчика на маршрутизацию моделей.

Риск для подрядчика: при росте цен на API (теоретически возможном, хотя тренд пока обратный) буфер может не покрыть перерасход. Страхуется положением о форс-мажоре и регуляторных изменениях.

T&M проект

Прямая передача затрат с наценкой 10–15% – наиболее честная схема. Клиент видит фактические затраты, подрядчик получает управленческую маржу за мониторинг и оптимизацию. Панель потребления – обязательный элемент: без неё прозрачная передача затрат теряет смысл, превращаясь в «верьте нам на слово».

Энтерпрайз / гибридная модель

Базовый пакет токенов рассчитывается через три сценария. Размер базы = базовый сценарий + 15%. Ставка за превышение = рыночная цена провайдера + 12% управленческой надбавки. Сверка – ежемесячно. Право на пересмотр базовой ставки – при изменении рыночных цен более чем на 25% за квартал.

Проекты в России: дополнительные соображения

Здесь три принципа, каждый из которых снижает юридический риск.

Первый – не обещать в договоре конкретный AI-инструмент, если он иностранный. Формулировка «AI-технологии по выбору подрядчика» с указанием требований к качеству результата юридически устойчивее, чем «ChatGPT Enterprise» или «Claude API».

Второй – структурировать AI-затраты как «материалы» в рамках договора подряда. Это даёт наиболее предсказуемый налоговый режим.

Третий – включить положение о регуляторных изменениях с правом пересмотра условий в течение 60 дней после вступления в силу нового нормативного акта. Учитывая скорость изменений в AI-регулировании России – право не теоретическое.

Сравнительная таблица моделей

Параметр	Прямая передача	Пакетирование	Гибрид
Прозрачность для клиента	Высокая	Низкая	Средняя
Предсказуемость бюджета	Низкая	Высокая	Средняя
Риск для подрядчика	Минимальный	Высокий	Умеренный
Операционная сложность	Высокая	Низкая	Средняя
Подходит для	T&M проекты	Fixed Price	Крупные проекты
Используют	Luxoft, DXC	EPAM, Softline	Big 4, Accenture

Парадокс в том, что модель с максимальной прозрачностью создаёт максимальную операционную нагрузку на обе стороны. Модель с минимальной прозрачностью – максимальный риск для подрядчика. Гибрид доминирует у крупных игроков потому, что балансирует между двумя крайностями – а какую модель из этих трёх используете вы?

Что стоит за вопросом «кто платит»

Когда клиент спрашивает «кто платит за токены?», он на самом деле задаёт три разных вопроса. Во-первых – предсказуемость: он хочет знать, что счёт не вырастет втрое без предупреждения. Во-вторых – контроль: он хочет понимать, на что тратятся деньги. В-третьих – доверие: он хочет убедиться, что AI-затраты не превратились в центр скрытой маржи подрядчика.

Хороший договор отвечает на все три вопроса явно, а не оставляет их подразумеваемыми.

Интересно, что самый болезненный конфликт возникает не там, где стороны не договорились о цене – а там, где они договорились, но не договорились о механизме контроля. Клиент готов платить $3 200 за AI API. Клиент не готов узнать об этом из счёта, а не из ежемесячного отчёта подрядчика. Разрыв между «инструмент есть» и «организация готова» проявляется и здесь – в виде контракта, который не поспевает за технологией.

Это – навык работы с ИИ, который не очевиден из первого взгляда. Проблема «убедительного результата», которую фиксирует Stanford AI Index в концепции «неровной границы», работает и здесь: AI-инструменты выглядят простыми снаружи и оказываются сложными внутри. То же справедливо для договоров, которые их сопровождают.

Вопрос к вам: в каком из трёх конфликтов – предсказуемость, контроль, доверие – вы чаще всего оказывались в ситуации «договор этого не покрывал»?

Специализация

От разовой задачи к системной работе с ИИ

Курс построен для менеджеров в СНГ: инструменты, доступные без VPN, правовые и организационные контексты, практика на реальных задачах. Фундамент + специализация по проектному управлению.

От pre-mortem до антикризисного плана

Переиспользуемые промпт-шаблоны

Сквозной кейс на реальном проекте

~300 часов экономии в год

Смотреть программу курса ->