Как выжать максимум из YandexGPT: что работает, а что нет

11 мин чтения
Stanislav Belyaev
Stanislav Belyaev Engineering Leader в Microsoft
Как выжать максимум из YandexGPT: что работает, а что нет

Миллионы людей пользуются Алисой каждый день – не потому что выбирают, а потому что она бесплатна, встроена в Яндекс Браузер и работает без VPN. YandexGPT, модель под капотом Алисы – лучшая российская модель в нашем бенчмарке, но до GPT-5.4 ей далеко.

Можно ли получить от неё ответы, близкие к GPT, если научиться правильно спрашивать? Мы проверили это в эксперименте: десять техник промптинга, шесть управленческих задач, два независимых LLM-судьи. Короткий ответ: да, можно – но не все техники работают, а некоторые делают хуже.

Ниже – конкретные шаблоны, которые вы можете скопировать в чат прямо сейчас, и антипаттерны, которых стоит избегать.

Три проблемы YandexGPT по сравнению с GPT-5.4

Прежде чем давать решения – разберёмся, что именно не так. Мы оценивали ответы по пяти измерениям: точность фактов, полнота, конкретность рекомендаций, честность (признаёт ли модель неопределённость) и ясность текста. Вот где YandexGPT проигрывает – и где выигрывает.

Уверенно врёт. Главная проблема – честность. GPT-5.4 предупреждает о неопределённости в двух ответах из трёх. YandexGPT – в одном из трёх. Остальные два раза она выдаёт данные с той же уверенностью, только данные неверные. Фактическая точность подтверждает: 75% проверяемых утверждений оказываются корректными у YandexGPT против 87% у GPT-5.4.

Пропускает важное. Вы спрашиваете про падение выручки – получаете диагноз и рекомендации. Но без альтернативных гипотез, без оговорки «если данные неполные», без раздела с ограничениями. GPT-5.4 добавит эти блоки сам. YandexGPT – нет, пока вы явно не попросите. Модель не ленится – ей просто не сказали, что эти секции нужны.

Даёт менее конкретные рекомендации. «Рассмотрите оптимизацию процессов» вместо «сократите время обработки возвратов с 14 до 5 дней, назначив ответственного». Разрыв в конкретности рекомендаций меньше, чем в честности – но заметен.

Зато пишет лучше. Ясность текста – единственное измерение, где YandexGPT обходит GPT-5.4. Алиса пишет чистый, хорошо структурированный русский – и это не только наши данные, мы подробно разобрали сильные стороны модели в обзоре YandexGPT. Проблема никогда не была в том, как она пишет – а в том, что.

Хорошая новость: все три проблемы решаются промптингом. Шаблоны ниже – это не общие советы «пишите лучше». Каждый элемент шаблона закрывает конкретный разрыв.

Три уровня усилий: от минуты до десяти

Уровень 1: шаблон ответа (1 минута)

Самый частый запрос менеджера – разобраться в ситуации и получить план действий. Добавьте к вопросу шаблон ответа – пять строк, которые меняют всё. Нажмите «Выполнить» и сравните результаты:

Попробуйте сами
Ответ на жалобу клиента: YandexGPT vs GPT-5.4
Вы
Клиент написал в поддержку: «Третий раз за месяц заказ приходит с повреждённой упаковкой. Прошлые два раза мне обещали разобраться, но ничего не изменилось. Если это повторится – уйду к конкурентам и напишу отзыв». Клиент с нами 2 года, средний чек 12 000 руб./мес. Как ответить и что сделать внутри? Ответь строго в следующем формате: ## Краткий вывод (2–3 предложения) ## Ответ клиенту (готовый текст письма, от имени руководителя отдела) ## Внутренние действия - Что проверить (конкретно: номера заказов, этапы логистики, фото повреждений) - Кого подключить (должности и зоны ответственности) - Дедлайны для каждого действия ## Компенсация (варианты с суммами или процентами) ## Ограничения и оговорки ## Как предотвратить повторение (системные изменения, а не разовые)
Сравниваем:
yandexgpt/aliceai-llm · openai/gpt-5.4

Секция «Ограничения и оговорки» – ключевая. Без неё YandexGPT уверенно предложит план, не предупреждая, что ей неизвестны детали логистики или условия договора. С ней – начинает помечать, где не уверена. Модель знает, что не знает – но только если вы просите об этом явно.

В нашем эксперименте этот приём побеждал наивный промпт в 76% случаев. Самое большое улучшение за минимальное усилие.

Уровень 2: роль и контекст (3–5 минут)

Другая задача – подготовиться к сложному разговору с сотрудником. Здесь важно задать роль и контекст, чтобы модель не давала абстрактных советов:

Попробуйте сами
Подготовка к 1:1: YandexGPT vs GPT-5.4
Вы
Ты – опытный руководитель команды разработки, 8 лет в управлении. Ситуация: разработчик Алексей, в команде 1,5 года. Последние два спринта закрывает на 60% от плана. Раньше стабильно 90%+. Коллеги жалуются, что он стал пропускать код-ревью. На прошлой неделе опоздал на дейли три раза. При этом качество кода не упало – то, что он делает, делает хорошо. Завтра 1:1. Помоги подготовиться. Ответь строго по формату: ## Гипотезы: что может происходить ## План разговора (конкретные вопросы, в каком порядке) ## Чего не делать в этом разговоре ## Возможные договорённости по итогу ## Ограничения и оговорки
Сравниваем:
yandexgpt/aliceai-llm · openai/gpt-5.4

Роль задаёт глубину ответа – «опытный руководитель» даёт другие советы, чем «HR-консультант». Контекст с конкретными фактами (60% плана, три опоздания, качество не упало) не даёт модели скатиться в общие фразы.

Уровень 3: XML-шаблон (10 минут)

Третья задача – аналитическая записка для руководства. Здесь данных много, и нужно, чтобы модель не потеряла ни одну цифру:

Попробуйте сами
Аналитическая записка: YandexGPT vs GPT-5.4
Вы
<task> Подготовить аналитическую записку для директора по итогам квартала. </task> <context> Компания: интернет-магазин электроники, 45 сотрудников. Рынок: бытовая электроника, средний сегмент. Прямые конкуренты – Ситилинк, DNS. </context> <data> - Выручка Q1: 42 млн руб. (план 51 млн, -18%) - Трафик сайта: +12% к Q4 (рекламный бюджет увеличен на 30%) - Средний чек: снизился с 8 700 руб. до 6 200 руб. (-29%) - Возвраты: выросли с 4% до 11% - NPS: упал с 47 до 31 - Отток подписчиков рассылки: 8% (норма 3%) - Новый склад запущен в феврале, 40% заказов идут через него </data> <question>Что произошло, в чём корневые причины и что делать в Q2?</question> <output_format> # Резюме для директора (3 предложения) # Диагноз: что пошло не так ## Причина 1: [название] - **Факт**: цифра из данных - **Связь**: как это повлияло на выручку ## Причина 2: [название] ... # План действий на Q2 | # | Действие | Ожидаемый эффект | Ответственный | Срок | # Риски плана # Чего мы не знаем (ограничения анализа) </output_format> <constraints> - Каждый вывод привязывай к конкретной цифре из <data> - Если данных недостаточно для вывода – укажи, какие данные нужны - Записка для директора: без жаргона, с конкретными числами </constraints>
Сравниваем:
yandexgpt/aliceai-llm · openai/gpt-5.4

XML-теги создают однозначные границы секций, которые YandexGPT парсит лучше, чем свободный текст. Исследования показывают аналогичный эффект: гибридные структуры дают непропорционально большой прирост именно на менее сильных моделях.

Для быстрого вопроса – уровня 1 достаточно. Для записки руководству – уровень 3 оправдан.

Этот шаблон работает для анализа выручки. Но когда задача другая – подготовить OKR, провести 1:1 с сотрудником, проверить договор поставщика – структура промпта меняется. Другие секции, другие ограничения, другая роль. Какие элементы шаблона оставить, а какие заменить – это уже не копирование, а навык. В открытом модуле Фундамента вы отработаете его на девяти разных задачах менеджера.

Анализ выручки – одна задача из девяти. В открытом модуле: письма, переговоры, 1:1, отчёты – каждая со своей структурой промпта. Бесплатно.

Доступ сразу после регистрации

Начать обучение

Бонусный приём: самокритика

Попросите YandexGPT перечитать собственный ответ. Этот промпт отправляется вторым сообщением – после того, как модель уже ответила на ваш вопрос:

Перечитай свой ответ. Найди 3 слабых места: где ты была неконкретна, где могли быть ошибки, что упустила. Затем дай улучшенную версию.

Вопреки исследованиям, показавшим, что малые модели не способны к самокритике – на YandexGPT это работает. Модель не находит фактические ошибки, но находит пропуски: «не упомянула сроки, не привела альтернативы, не указала ограничения». Этот тип критики не требует глубоких мета-когнитивных способностей – модель просто сверяет ответ с представлением о полноте.

ROI хуже, чем у структурированного шаблона – нужен второй запрос, а эффект скромнее. Но если ответ уже получен и вы хотите его улучшить – это рабочий приём.

Что не делать

Не разбивайте задачу на три хода. У YandexGPT контекстное окно 8K токенов. К третьему ходу диалога модель теряет данные из начала разговора. В нашем эксперименте это единственная техника, которая дала результат хуже наивного промпта. Для моделей с большим контекстом (Qwen3 Max: 128K) декомпозиция работает, для YandexGPT – нет. Лучше один хороший промпт, чем три простых вопроса.

Не пишите КАПСОМ. Популярный совет из блогов – «напиши инструкцию КАПСОМ, и модель будет слушаться». В большинстве случаев эффект объясняется тем, что вместе с КАПСОМ автор добавляет конкретные инструкции. Мы изолировали чистый КАПС – без дополнительных указаний. На YandexGPT разница с обычным текстом – на уровне шума.

Не ругайтесь на модель. YandexGPT буквально отвечает хуже, когда на неё кричат. Вероятный механизм: модель, обученная на обратной связи от пользователей, ассоциирует агрессивный тон с ситуациями, где пользователь недоволен – и переключается в режим извинений вместо аналитики. Если кто-то скажет «я ругаюсь на Алису – и она отвечает лучше» – скорее всего, вместе с руганью он добавляет конкретные инструкции. Помогает структура, а не тон.

Не полагайтесь на Chain-of-Thought без шаблона. «Подумай пошагово» заставляет YandexGPT больше рефлексировать и меньше действовать. Честность ответа растёт, но конкретность рекомендаций – почти нет. Если нужен план действий – структурированный шаблон лучше.

Знать антипаттерны – значит не повторять чужие ошибки. Но когда ни один шаблон из статьи не подходит к вашей задаче – нужно понимать, как устроен промпт, чтобы собрать свой. Именно это разбирается в Фундаменте: не список готовых промптов, а логика, по которой они строятся.

Структура промпта, роль, персона, семантика – 9 управленческих задач в открытом модуле. Разберёте, как собирать промпт под любую ситуацию. Бесплатно.

Доступ сразу после регистрации

Начать обучение

Как мы это проверили

Полное описание – в анонсе эксперимента. Здесь – коротко.

Четыре модели, доступные в России без VPN: GigaChat-Ultra, GigaChat-2-Max, YandexGPT (Алиса) и Qwen3 Max. Десять техник промптинга на шести управленческих задачах – от анализа падения выручки до увольнения по ТК РФ. Каждую комбинацию повторили 6 раз. Для сравнения те же задачи решали GPT-5.4, Claude Sonnet 4.6 и Kimi K2.5 с наивными промптами.

Оценка – попарная: судья видит два ответа (наивный vs. улучшенный) и выбирает лучший. Два независимых судьи (Claude Opus 4.6 и Gemini 3.1 Pro), слепые к технике и модели. Если судьи не согласны – ничья.

Ограничения: оценку проводили LLM-судьи, а не люди. Все техники написаны экспертом по промптингу – типичный менеджер напишет хуже, реальный эффект будет меньше. YandexGPT может быть обновлена Яндексом в любой момент – результаты актуальны на апрель 2026 года. Все промпты и шаблоны опубликованы в открытом доступе.

Что дальше

Данные по GigaChat-Ultra, GigaChat-2-Max и Qwen3 Max выходят отдельной статьёй – с разбором, почему промптинг помогает больше всего моделям среднего уровня. А если вы пока выбираете, какой инструмент использовать – начните с полного сравнения GenAI инструментов.

Эта статья дала вам три шаблона для одной задачи. В работе менеджера задач – десятки: подготовить план проекта, написать сложное письмо, разобрать конфликт в команде, проверить юридический документ. Каждая требует другой структуры промпта. Копировать шаблон из статьи для каждого случая не получится – нужно понимать, как промпт устроен и какой элемент за что отвечает.

Фундамент

От шаблона к навыку

В этой статье – один шаблон на одну задачу. В Фундаменте курса – девять задач менеджера, каждая со своей структурой промпта. Вы разберёте, зачем нужна роль, как контекст влияет на ответ, когда XML-теги дают прирост, а когда Chain-of-Thought мешает. Не список готовых промптов – а навык собирать промпт под любую ситуацию, на любой модели.

9 задач менеджера: письма и переговоры и отчёты и 1:1
Структура промпта: роль и контекст и формат вывода
Почему одни техники работают на YandexGPT а другие нет
Практика на своих данных – без регистрации и оплаты
Stanislav Belyaev

Stanislav Belyaev

Engineering Leader в Microsoft

18 лет в управлении инженерными командами. Основатель mysummit.school. 700+ выпускников в Яндекс Практикуме и Стратоплане.