4 техники промптинга, проверенные на 7 моделях: гайд с воркшопа

28 мин чтения
Stanislav Belyaev
Stanislav Belyaev Engineering Leader в Microsoft
4 техники промптинга, проверенные на 7 моделях: гайд с воркшопа

«Проанализируй проект и дай рекомендации» – один промпт, семь моделей, и GPT-5.4 выдал 2231 слово размытых советов, а Claude Sonnet – 11 хвалебных фраз типа «отличная структура бюджета». Стоило переписать запрос по структуре из пяти элементов – все семь моделей уложились в 346–443 слова, а похвала исчезла. Экономия токенов: от 41% до 79% в зависимости от модели.

Это не теория. Это данные с воркшопа «Промпт-инжиниринг на практике», который я провёл на конференции IIBA. Один проектный бриф, четыре техники, семь моделей, 28 запусков – и $0.054 за всё. Дешевле чашки кофе из автомата.

Ниже – все четыре техники с готовыми промптами. Каждый можно запустить прямо здесь – нажмите кнопку, и две модели выполнят промпт на том же проектном брифе. Данные включены в каждый промпт, ничего копировать не нужно.

Видео и материалы воркшопа: hackmd.io/@belyaevstanislav/S1416ngRZg

Проект для экспериментов

Все четыре техники работали с одним кейсом – «БонусПлюс», мобильное приложение лояльности для розничной сети из 340 магазинов. Бюджет 18 млн рублей, 4 месяца на MVP, команда на аутсорсе. В бриф специально заложены 16 проблем: от непроверенной совместимости с 1С до сомнительной рыночной статистики и отсутствия QA на стороне заказчика.

Полный текст брифа включён в каждый исполняемый промпт ниже. Дальше я буду ссылаться на конкретные проблемы из него.

Техника 1: Структура промпта – 5 элементов

Суть простая: любой рабочий промпт содержит пять блоков – Роль, Контекст, Задача, Ограничения, Формат. Это не магия, а техническое задание, написанное для машины вместо подрядчика.

Плохой промпт (для контраста)

Запустите и посмотрите, что получится – стена текста без структуры:

Попробуйте сами
Плохой промпт – без структуры
Вы
Проанализируй этот проект и дай рекомендации. Проектный бриф: Платформа лояльности «БонусПлюс» Общая информация Заказчик: ООО «РитейлГрупп» – сеть из 340 магазинов формата «у дома» в Центральном федеральном округе. Цель проекта: Разработка и запуск мобильного приложения с программой лояльности для увеличения среднего чека и частоты покупок. Бюджет: 18 млн рублей на 2025–2026 годы. Срок: MVP через 4 месяца (к 1 сентября 2025), полный запуск – к 1 декабря 2025. Рыночный контекст Рынок программ лояльности в России вырос на 24% в 2025 году (данные NielsenIQ). Среди продуктовых сетей 78% уже имеют приложения с бонусными системами. Основные конкуренты: «Пятёрочка» (X5), «Магнит», «ВкусВилл». Средний срок окупаемости программ лояльности в ритейле – 14 месяцев. Текущая ситуация - У «РитейлГрупп» нет приложения. Действует пластиковая карта лояльности (выпущено 1,2 млн карт). - Средний чек: 870 руб. (по данным за Q1 2025). - Частота покупок: 3,2 раза в неделю у лояльных клиентов. - IT-отдел: 3 человека (системный администратор, 1С-программист, специалист техподдержки). - Серверная инфраструктура: on-premise (собственный ЦОД в Туле). Задачи проекта 1. Мобильное приложение (iOS + Android): электронная бонусная карта, персональные предложения на основе истории покупок, push-уведомления о скидках, геолокация ближайшего магазина. 2. Бэкенд-платформа: интеграция с кассовым ПО (1С:Розница), процессинг бонусов в реальном времени, аналитический модуль для маркетинга, API для партнёрских интеграций. 3. Миграция данных: перенос 1,2 млн клиентских профилей с пластиковых карт, сохранение накопленных бонусов, привязка истории покупок. Команда проекта - Менеджер проекта: Алексей Соколов (опыт: 3 года в IT-проектах, ранее – банковский сектор) - Разработка: аутсорс-команда «ДигиталСофт» (8 человек: 2 iOS, 2 Android, 2 backend, 1 QA, 1 DevOps) - Дизайн: фрилансер (рекомендация знакомого) - Маркетинг: штатный маркетолог + агентство на продвижение (бюджет 4 млн) Ожидаемые результаты (через 12 месяцев) - Установки приложения: 0 -> 500 000 - Средний чек: 870 руб. -> 1 050 руб. (+21%) - Частота покупок: 3,2/нед. -> 3,8/нед. (+19%) - Доля покупок с приложением: 0% -> 35% - NPS: не измерялся -> 45+ Риски (по оценке заказчика) 1. Низкая скорость загрузки в сельской местности (30% магазинов – малые города и посёлки). 2. Сопротивление кассиров переходу на новую систему. 3. Конкуренция с крупными сетями за внимание пользователей. Бюджет - Разработка (аутсорс): 9 000 000 руб. - Дизайн и UX: 1 200 000 руб. - Серверная инфраструктура: 2 800 000 руб. - Маркетинг и продвижение: 4 000 000 руб. - Непредвиденные расходы: 1 000 000 руб. - Итого: 18 000 000 руб. Ключевые допущения - Аутсорс-команда будет выделена на проект full-time с 1 мая 2025. - 1С:Розница поддерживает API для интеграции (проверка не проводилась). - Клиенты пластиковых карт перейдут на приложение в течение 6 месяцев. - Серверная инфраструктура справится с нагрузкой 500 000 пользователей.
Сравниваем:
openai/gpt-5.4-nano · deepseek/deepseek-v3.2

Структурированный промпт

Теперь запустите тот же бриф, но со структурой. Сравните длину и содержание ответов:

Попробуйте сами
Структурированный промпт – 5 элементов
Вы
# РОЛЬ Ты – опытный проектный менеджер с 10-летним стажем в IT-консалтинге. Твой подход: risk-first – сначала ищешь проблемы, потом возможности. # КОНТЕКСТ Мне нужно через 2 часа представить руководству оценку проекта. Нужен честный разбор, а не презентация. # ЗАДАЧА Проанализируй проектный бриф ниже. Выдели: 1. Три главных риска (с оценкой вероятности: высокая/средняя/низкая) 2. Что в брифе недосказано или противоречиво 3. Какие вопросы задать заказчику ДО старта # ОГРАНИЧЕНИЯ - НЕ хвали проект – ищи слабые места - НЕ предлагай решения – только диагностика - Объём: максимум 400 слов - Формат: три раздела с буллетами # ДАННЫЕ Проектный бриф: Платформа лояльности «БонусПлюс» Общая информация Заказчик: ООО «РитейлГрупп» – сеть из 340 магазинов формата «у дома» в Центральном федеральном округе. Цель проекта: Разработка и запуск мобильного приложения с программой лояльности для увеличения среднего чека и частоты покупок. Бюджет: 18 млн рублей на 2025–2026 годы. Срок: MVP через 4 месяца (к 1 сентября 2025), полный запуск – к 1 декабря 2025. Рыночный контекст Рынок программ лояльности в России вырос на 24% в 2025 году (данные NielsenIQ). Среди продуктовых сетей 78% уже имеют приложения с бонусными системами. Основные конкуренты: «Пятёрочка» (X5), «Магнит», «ВкусВилл». Средний срок окупаемости программ лояльности в ритейле – 14 месяцев. Текущая ситуация - У «РитейлГрупп» нет приложения. Действует пластиковая карта лояльности (выпущено 1,2 млн карт). - Средний чек: 870 руб. (по данным за Q1 2025). - Частота покупок: 3,2 раза в неделю у лояльных клиентов. - IT-отдел: 3 человека (системный администратор, 1С-программист, специалист техподдержки). - Серверная инфраструктура: on-premise (собственный ЦОД в Туле). Задачи проекта 1. Мобильное приложение (iOS + Android): электронная бонусная карта, персональные предложения на основе истории покупок, push-уведомления о скидках, геолокация ближайшего магазина. 2. Бэкенд-платформа: интеграция с кассовым ПО (1С:Розница), процессинг бонусов в реальном времени, аналитический модуль для маркетинга, API для партнёрских интеграций. 3. Миграция данных: перенос 1,2 млн клиентских профилей с пластиковых карт, сохранение накопленных бонусов, привязка истории покупок. Команда проекта - Менеджер проекта: Алексей Соколов (опыт: 3 года в IT-проектах, ранее – банковский сектор) - Разработка: аутсорс-команда «ДигиталСофт» (8 человек: 2 iOS, 2 Android, 2 backend, 1 QA, 1 DevOps) - Дизайн: фрилансер (рекомендация знакомого) - Маркетинг: штатный маркетолог + агентство на продвижение (бюджет 4 млн) Ожидаемые результаты (через 12 месяцев) - Установки приложения: 0 -> 500 000 - Средний чек: 870 руб. -> 1 050 руб. (+21%) - Частота покупок: 3,2/нед. -> 3,8/нед. (+19%) - Доля покупок с приложением: 0% -> 35% - NPS: не измерялся -> 45+ Риски (по оценке заказчика) 1. Низкая скорость загрузки в сельской местности (30% магазинов – малые города и посёлки). 2. Сопротивление кассиров переходу на новую систему. 3. Конкуренция с крупными сетями за внимание пользователей. Бюджет - Разработка (аутсорс): 9 000 000 руб. - Дизайн и UX: 1 200 000 руб. - Серверная инфраструктура: 2 800 000 руб. - Маркетинг и продвижение: 4 000 000 руб. - Непредвиденные расходы: 1 000 000 руб. - Итого: 18 000 000 руб. Ключевые допущения - Аутсорс-команда будет выделена на проект full-time с 1 мая 2025. - 1С:Розница поддерживает API для интеграции (проверка не проводилась). - Клиенты пластиковых карт перейдут на приложение в течение 6 месяцев. - Серверная инфраструктура справится с нагрузкой 500 000 пользователей.
Сравниваем:
openai/gpt-5.4-nano · deepseek/deepseek-v3.2

Что произошло

Плохой промпт дал то, что и следовало ожидать: стену текста без структуры. GPT-5.4 написал 2231 слово – в пять раз больше, чем нужно для презентации. Claude Sonnet расставил 11 комплиментов проекту, в котором специально заложены 16 проблем. DeepSeek V4 Flash вообще пересказал бриф обратно, добавив пару общих фраз про «необходимость тщательного планирования».

Структурированный промпт перевернул картину. Все семь моделей – от GPT-5.4 до Gemma 4-26B – уложились в диапазон 346–443 слова. Похвала упала до 0–1 фразы. Появились конкретные риски с вероятностями. Формат – три раздела с буллетами, как и просили.

Сравнение результатов: плохой vs структурированный промпт на 4 моделях

Почему это работает

Ограничение «НЕ хвали проект» – не вежливая просьба, а инструкция, которая перенаправляет внимание модели. Без него модель по умолчанию сбалансирует плюсы и минусы – потому что так устроены данные, на которых она обучалась. Явный запрет убирает этот ‘баланс’ и высвобождает токены на анализ.

Если вам знакомы 5 элементов промпта, это та же идея – только здесь с данными валидации на семи моделях.

В нашем эксперименте Make Weak Model Great Again структурированный промпт побеждает неструктурированный в 73–82% случаев – на выборке из 1700+ запусков. Здесь, на воркшопе, те же 28 запусков подтвердили закономерность.

Техника 2: Few-Shot – покажи, что хочешь получить

Few-Shot – это когда вы даёте модели два-три примера нужного формата прямо в промпте. Не объясняете формат словами, а показываете готовый образец.

Промпт

Попробуйте сами
Few-Shot – два примера задают формат
Вы
Извлеки риски из проектного брифа. Формат каждого риска – строго как в примерах ниже. Пример 1: Риск: Ключевой разработчик уходит в середине проекта Вероятность: Средняя Последствие: Задержка на 3-6 недель, потеря экспертизы Индикатор: Разработчик начал обновлять LinkedIn, просит отгулы на собеседования Митигация: Парное программирование + документация решений Пример 2: Риск: Заказчик меняет требования после утверждения ТЗ Вероятность: Высокая Последствие: Переработка 20-40% сделанного, рост бюджета Индикатор: Заказчик говорит «а ещё хотелось бы...» после каждого демо Митигация: Change Request процедура с оценкой стоимости каждого изменения Теперь извлеки риски из этого брифа (минимум 5): Проектный бриф: Платформа лояльности «БонусПлюс» Общая информация Заказчик: ООО «РитейлГрупп» – сеть из 340 магазинов формата «у дома» в Центральном федеральном округе. Цель проекта: Разработка и запуск мобильного приложения с программой лояльности для увеличения среднего чека и частоты покупок. Бюджет: 18 млн рублей на 2025–2026 годы. Срок: MVP через 4 месяца (к 1 сентября 2025), полный запуск – к 1 декабря 2025. Рыночный контекст Рынок программ лояльности в России вырос на 24% в 2025 году (данные NielsenIQ). Среди продуктовых сетей 78% уже имеют приложения с бонусными системами. Основные конкуренты: «Пятёрочка» (X5), «Магнит», «ВкусВилл». Средний срок окупаемости программ лояльности в ритейле – 14 месяцев. Текущая ситуация - У «РитейлГрупп» нет приложения. Действует пластиковая карта лояльности (выпущено 1,2 млн карт). - Средний чек: 870 руб. (по данным за Q1 2025). - Частота покупок: 3,2 раза в неделю у лояльных клиентов. - IT-отдел: 3 человека (системный администратор, 1С-программист, специалист техподдержки). - Серверная инфраструктура: on-premise (собственный ЦОД в Туле). Задачи проекта 1. Мобильное приложение (iOS + Android): электронная бонусная карта, персональные предложения на основе истории покупок, push-уведомления о скидках, геолокация ближайшего магазина. 2. Бэкенд-платформа: интеграция с кассовым ПО (1С:Розница), процессинг бонусов в реальном времени, аналитический модуль для маркетинга, API для партнёрских интеграций. 3. Миграция данных: перенос 1,2 млн клиентских профилей с пластиковых карт, сохранение накопленных бонусов, привязка истории покупок. Команда проекта - Менеджер проекта: Алексей Соколов (опыт: 3 года в IT-проектах, ранее – банковский сектор) - Разработка: аутсорс-команда «ДигиталСофт» (8 человек: 2 iOS, 2 Android, 2 backend, 1 QA, 1 DevOps) - Дизайн: фрилансер (рекомендация знакомого) - Маркетинг: штатный маркетолог + агентство на продвижение (бюджет 4 млн) Ожидаемые результаты (через 12 месяцев) - Установки приложения: 0 -> 500 000 - Средний чек: 870 руб. -> 1 050 руб. (+21%) - Частота покупок: 3,2/нед. -> 3,8/нед. (+19%) - Доля покупок с приложением: 0% -> 35% - NPS: не измерялся -> 45+ Риски (по оценке заказчика) 1. Низкая скорость загрузки в сельской местности (30% магазинов – малые города и посёлки). 2. Сопротивление кассиров переходу на новую систему. 3. Конкуренция с крупными сетями за внимание пользователей. Бюджет - Разработка (аутсорс): 9 000 000 руб. - Дизайн и UX: 1 200 000 руб. - Серверная инфраструктура: 2 800 000 руб. - Маркетинг и продвижение: 4 000 000 руб. - Непредвиденные расходы: 1 000 000 руб. - Итого: 18 000 000 руб. Ключевые допущения - Аутсорс-команда будет выделена на проект full-time с 1 мая 2025. - 1С:Розница поддерживает API для интеграции (проверка не проводилась). - Клиенты пластиковых карт перейдут на приложение в течение 6 месяцев. - Серверная инфраструктура справится с нагрузкой 500 000 пользователей.
Сравниваем:
openai/gpt-5.4-nano · deepseek/deepseek-v3.2

Что произошло

100% моделей выдали ответ в точном пятиэлементном формате. Все семь – включая Gemma 4-26B и GPT-5.4 Nano, которые в других техниках путали структуру. Количество найденных рисков варьировалось – от 5 у Nano до 12 у GPT-5.4 – но формат был идентичным.

Это самая сильная техника для контроля формата. Если вам нужен конкретный шаблон – отчёт, риск-реестр, оценка – два примера работают надёжнее, чем два абзаца объяснений.

Почему это работает

Модель учится не из ваших инструкций, а из паттернов. Два примера создают паттерн, которому проще следовать, чем текстовому описанию. Это особенно критично для слабых моделей: они плохо интерпретируют сложные словесные инструкции, но отлично копируют структуру.

В данных нашего эксперимента Few-Shot побеждает в 75–89% случаев. Самый высокий процент из всех четырёх техник.

Структура, Few-Shot, XML-теги – три техники из этой статьи подробно разобраны в бесплатном модуле курса. 9 практических задач менеджера, любая модель.

Доступ сразу после регистрации

Начать обучение

Техника 3: XML-теги – данные отдельно от инструкций

XML-теги решают конкретную проблему: когда в промпте одновременно есть инструкции и данные, модель путает одно с другим. Теги создают чёткую границу – вот что делать, вот с чем работать.

Промпт

Попробуйте сами
XML-теги – данные отдельно от инструкций
Вы
<role> Ты – финансовый контролёр. Проверяешь цифры, а не стратегию. </role> <context> Компания планирует проект. Бриф написан менеджером, который заинтересован в одобрении – поэтому цифры могут быть оптимистичны. </context> <project_brief> Проектный бриф: Платформа лояльности «БонусПлюс» Общая информация Заказчик: ООО «РитейлГрупп» – сеть из 340 магазинов формата «у дома» в Центральном федеральном округе. Цель проекта: Разработка и запуск мобильного приложения с программой лояльности для увеличения среднего чека и частоты покупок. Бюджет: 18 млн рублей на 2025–2026 годы. Срок: MVP через 4 месяца (к 1 сентября 2025), полный запуск – к 1 декабря 2025. Рыночный контекст Рынок программ лояльности в России вырос на 24% в 2025 году (данные NielsenIQ). Среди продуктовых сетей 78% уже имеют приложения с бонусными системами. Основные конкуренты: «Пятёрочка» (X5), «Магнит», «ВкусВилл». Средний срок окупаемости программ лояльности в ритейле – 14 месяцев. Текущая ситуация - У «РитейлГрупп» нет приложения. Действует пластиковая карта лояльности (выпущено 1,2 млн карт). - Средний чек: 870 руб. (по данным за Q1 2025). - Частота покупок: 3,2 раза в неделю у лояльных клиентов. - IT-отдел: 3 человека (системный администратор, 1С-программист, специалист техподдержки). - Серверная инфраструктура: on-premise (собственный ЦОД в Туле). Задачи проекта 1. Мобильное приложение (iOS + Android): электронная бонусная карта, персональные предложения на основе истории покупок, push-уведомления о скидках, геолокация ближайшего магазина. 2. Бэкенд-платформа: интеграция с кассовым ПО (1С:Розница), процессинг бонусов в реальном времени, аналитический модуль для маркетинга, API для партнёрских интеграций. 3. Миграция данных: перенос 1,2 млн клиентских профилей с пластиковых карт, сохранение накопленных бонусов, привязка истории покупок. Команда проекта - Менеджер проекта: Алексей Соколов (опыт: 3 года в IT-проектах, ранее – банковский сектор) - Разработка: аутсорс-команда «ДигиталСофт» (8 человек: 2 iOS, 2 Android, 2 backend, 1 QA, 1 DevOps) - Дизайн: фрилансер (рекомендация знакомого) - Маркетинг: штатный маркетолог + агентство на продвижение (бюджет 4 млн) Ожидаемые результаты (через 12 месяцев) - Установки приложения: 0 -> 500 000 - Средний чек: 870 руб. -> 1 050 руб. (+21%) - Частота покупок: 3,2/нед. -> 3,8/нед. (+19%) - Доля покупок с приложением: 0% -> 35% - NPS: не измерялся -> 45+ Риски (по оценке заказчика) 1. Низкая скорость загрузки в сельской местности (30% магазинов – малые города и посёлки). 2. Сопротивление кассиров переходу на новую систему. 3. Конкуренция с крупными сетями за внимание пользователей. Бюджет - Разработка (аутсорс): 9 000 000 руб. - Дизайн и UX: 1 200 000 руб. - Серверная инфраструктура: 2 800 000 руб. - Маркетинг и продвижение: 4 000 000 руб. - Непредвиденные расходы: 1 000 000 руб. - Итого: 18 000 000 руб. Ключевые допущения - Аутсорс-команда будет выделена на проект full-time с 1 мая 2025. - 1С:Розница поддерживает API для интеграции (проверка не проводилась). - Клиенты пластиковых карт перейдут на приложение в течение 6 месяцев. - Серверная инфраструктура справится с нагрузкой 500 000 пользователей. </project_brief> <task> Проверь данные из тега <project_brief>: 1. Какие цифры выглядят подозрительно оптимистичными? Почему? 2. Какие расчёты можно проверить арифметически прямо сейчас? 3. Каких цифр не хватает для принятия решения? Формат: таблица | Утверждение | Проблема | Что проверить | </task>
Сравниваем:
openai/gpt-5.4-nano · deepseek/deepseek-v3.2

Что произошло

Все семь моделей выдали табличный формат. Но интереснее другое: роль «финансовый контролёр» заставила модели считать.

Все семь нашли проблему с маркетинговой математикой – бюджет на маркетинг 4 млн при цели 500 000 установок даёт CPI = 8 рублей, что нереалистично для российского рынка. Все нашли арифметические несоответствия в бюджете. Это те же самые модели, которые в плохом промпте просто пересказывали цифры, не проверяя.

Глубина при этом различалась радикально: GPT-5.4 выдал таблицу на 36 строк, Gemma – на 7 строк. Формат одинаковый, наполнение – нет.

Почему это работает

Тег <project_brief> говорит модели: это данные, а не инструкции. Без тегов модель может принять утверждения из брифа за факты. С тегами она обрабатывает их как входные данные, которые нужно проверить. А роль финансового контролёра задаёт фокус – проверяй цифры, а не оценивай стратегию.

Если хотите больше данных по XML-тегам – в наших тестах на российских моделях XML-шаблон побеждает в 74–85% случаев.

Техника 4: Red Teaming – модель атакует свой ответ

Red Teaming – это второй промпт, который отправляется после первого анализа. Модель переключается в роль скептика и атакует собственные выводы.

Промпт (отправляется ПОСЛЕ структурированного анализа)

Теперь переключись в роль. Ты – скептичный инвестор с 20-летним
опытом, который ищет причины НЕ вкладывать деньги в этот проект.

Атакуй свой предыдущий анализ:
1. Какие риски ты пропустил?
2. Где ты был слишком мягок в оценке?
3. Какие предположения ты принял без проверки?
4. Что развалится в первые 30 дней?

Будь жёстким. Никаких «тем не менее проект имеет потенциал».

Что произошло

Каждая модель нашла 2–3 дополнительных риска, которые пропустила в первом проходе. Типичная находка – vendor lock-in: зависимость от единственного аутсорсера, у которого весь код и экспертиза. Этот риск был систематически пропущен всеми моделями в первоначальном анализе – и систематически найден в Red Teaming.

Но самое показательное – про непроверенную рыночную статистику. В брифе написано «рынок вырос на 24%» со ссылкой на NielsenIQ. Только одна модель из семи (GPT-5.4) в одном из четырёх промптов поставила под сомнение эту цифру. Остальные приняли её как факт.

Почему это работает

Первый проход создаёт инерцию – модель выбрала фрейминг и следует ему. Red Teaming разрушает эту инерцию, задавая противоположную роль. «Ищи причины НЕ вкладывать» – это не просто другой ракурс, это другая задача оптимизации.

Red Teaming и ещё 8 техник – в бесплатном модуле курса. Практика на реальных управленческих задачах, без воды и теории ради теории.

Доступ сразу после регистрации

Начать обучение

Что AI систематически пропускает

28 запусков по одному брифу с 16 заложенными проблемами дали картину, которую я не встречал в других статьях о промптинге. Обычно пишут «AI нашёл интересные инсайты» – но никто не проверяет, что именно он не нашёл.

Итого: лучшая модель (GPT-5.4) обнаружила 50% заложенных проблем, суммарно по всем четырём промптам. Худшая (GPT-5.4 Nano) – 22%. Среднее по семи моделям – где-то между. Ни одна модель не нашла все 16.

Но интереснее не средние цифры, а слепые зоны.

Проблема #15 – «Нет QA на стороне заказчика» – была невидима для всех моделей во всех промптах. Ноль из 28 запусков. В брифе написано, что у заказчика три человека в IT-отделе (сисадмин, 1С-программист, техподдержка) – но ни одна модель не сделала вывод, что принимать работу аутсорсера будет некому. Для любого PM с опытом реальных проектов это первый вопрос: кто на стороне заказчика будет принимать релизы? Кто проведёт UAT? Для AI – невидимая проблема.

Проблема #12 – «Рост рынка на 24% – непроверенная цифра» – нашлась один раз из 28 попыток. Одна модель, один промпт. В брифе написано «рынок вырос на 24% (данные NielsenIQ)» – и шесть из семи моделей включили эту цифру в свой анализ как факт. Не проверили источник, не усомнились в актуальности, не спросили, за какой период. Ссылка на NielsenIQ сработала как ‘знак качества’ – и модели её не перепроверяют.

Я назову это ‘ошибкой авторитета’: если данные поданы с указанием источника, модель принимает их за истину. Это прямое следствие того, как работает обучение – данные с источниками в тренировочном корпусе обычно более надёжны. Но в реальном проектном брифе кто угодно может написать «по данным McKinsey».

Три уровня находок

Данные с воркшопа хорошо ложатся на три уровня:

Уровень 1 – явные проблемы. Непроверенная совместимость с 1С, фрилансер на дизайне без бэкапа, нехватка бюджета на непредвиденные расходы. Это находят все модели, даже Nano. Достаточно структурированного промпта.

Уровень 2 – расчётные проблемы. CPI в 8 рублей, несовместимость сроков MVP с объёмом функций, нереалистичная конверсия пластиковых карт в приложение. Это находят большинство моделей, но только с правильной ролью – «финансовый контролёр» или «risk-first PM». Без роли модели не включают калькулятор.

Уровень 3 – контекстные проблемы. Отсутствие QA со стороны заказчика, vendor lock-in с единственным подрядчиком, сомнительность рыночной статистики. Это находят единицы, и то не всегда. Здесь нужен человеческий опыт – знание того, что бывает в реальных проектах, а не в документах.

Три уровня проблем: что AI находит и что пропускает

Вот что это значит: AI – отличный первый проход. Он поймает очевидные бюджетные нестыковки и организационные риски. Но он не заменяет эксперта, который знает, на что смотреть.

Хм.

Если вы используете AI для анализа проектов – а я думаю, вы должны – имейте в виду: то, что модель нашла, не равно тому, что есть. Слепые зоны не случайны, они системны. Модели хорошо находят то, что явно написано, и плохо – то, что нужно вывести из контекста.

Практический итог

Четыре техники – четыре инструмента для разных ситуаций.

Р-К-З-О-Ф (Роль, Контекст, Задача, Ограничения, Формат) – базовая гигиена. Если вы запомните только одно – запомните мнемонику. Она работает как чек-лист: прежде чем отправить промпт, пробегитесь по пяти буквам и проверьте, всё ли на месте.

Few-Shot – когда критичен формат. Два примера надёжнее двух абзацев объяснений. Особенно важно для слабых моделей и для задач, где нужен конкретный шаблон: риск-реестр, оценка, отчёт.

XML-теги – когда в промпте много данных. Разделяют инструкции и входные данные, не дают модели принять одно за другое.

Red Teaming – второй проход. Не замена первому анализу, а дополнение. Стоит ноль дополнительных денег, ломает инерцию первого ответа.

Все четыре техники работают на любой модели – GPT, Claude, Gemini, DeepSeek, GigaChat. Мы проверили на семи, включая Qwen 3.6-27B и Gemma 4-26B. Результаты различаются по глубине, но не по паттерну: структура выигрывает у хаоса независимо от провайдера.

И ещё одно: вся валидация стоила $0.054. Пятьдесят четыре тысячных доллара за 28 запусков на семи моделях. Промптинг – это не про дорогие инструменты. Это про то, как вы формулируете задачу.

Все материалы воркшопа, включая проектный бриф и промпты для самостоятельной практики: hackmd.io/@belyaevstanislav/S1416ngRZg

Специализация

От промптов – к системе

Фундамент курса разбирает все четыре техники из этой статьи на реальных управленческих задачах: структуру, Few-Shot, XML-теги, Red Teaming. Плюс ещё шесть техник, которые не поместились в воркшоп. Специализация для менеджеров – применение в планировании, аналитике и работе с командой.

От pre-mortem до антикризисного плана
Переиспользуемые промпт-шаблоны
Сквозной кейс на реальном проекте
~300 часов экономии в год
Stanislav Belyaev

Stanislav Belyaev

Engineering Leader в Microsoft

18 лет в управлении инженерными командами. Основатель mysummit.school. 700+ выпускников в Яндекс Практикуме и Стратоплане.