Исследования

Make Weak Model Great Again: промпты против слабых моделей

5 мин чтения

В марте 2026 года Минцифры опубликовало законопроект о «доверенных моделях» ИИ. Если его примут – вступление в силу планируется с сентября 2027 – госструктуры и критическая инфраструктура смогут использовать только модели из специального реестра. ChatGPT, Claude и Gemini, передающие данные за рубеж, могут быть ограничены. На устройства планируется обязательная предустановка российских нейросетей.

Проблема в том, что российские модели отстают. В нашем исследовании 54 моделей GigaChat набрал 3,26 из 5, GPT-5.4 – 4,80. Разрыв 32%.

Если GigaChat – всё, что у вас будет, можно ли вытянуть из него приемлемое качество с помощью грамотного промптинга?

Читать полностью
Make Weak Model Great Again: промпты против слабых моделей
Когда ИИ вредит обучению – и когда удваивает результат
9 мин

Когда ИИ вредит обучению – и когда удваивает результат

В марте 2025 года на SXSW EDU советник по стратегическому форсайту Синид Бовелл сделала доклад об ИИ и будущем образования. Без хайпа и без паники. Но с двумя исследованиями, которые меняют то, как стоит думать о роли ИИ в обучении.

Первое: группа студентов, использовавших ChatGPT без ограничений, показала результаты на 17% хуже контрольной группы, работавшей по учебнику. Второе: другая группа, где ИИ применялся в рамках полностью переработанной учебной системы, опередила традиционную лекцию вдвое.

Один и тот же инструмент. Противоположные результаты. Разница – в подходе.

ИИ экономит учителю 6 часов в неделю. Но 97% этого не замечают
11 мин

ИИ экономит учителю 6 часов в неделю. Но 97% этого не замечают

Опрос Gallup и Walton Family Foundation (2024–2025, репрезентативная выборка учителей США) зафиксировал впечатляющую цифру: преподаватели, регулярно использующие AI, экономят в среднем 5,9 часов в неделю – эквивалент шести полных рабочих недель за учебный год. Звучит как решённая проблема.

Но параллельный опрос Royal Society of Chemistry (2024, Великобритания) показывает другую картину: 44% учителей пробовали AI, но только 3% сообщили о реальном снижении нагрузки. Учитель математики из Ирландии объяснил разрыв точнее, чем любая статистика: «AI генерирует рабочие листы быстро, но их нужно тщательно проверять – и экономия времени оказывается меньше, чем казалось».

Кто прав? Мы уже разбирали кризис AI в образовании со стороны учеников – 86% школьников используют нейросети, но критическое мышление деградирует. Теперь – сторона преподавателей. За последние два года накопилось достаточно экспериментальных данных, чтобы ответить на этот вопрос не мнениями, а цифрами.

AI не делает вас тупее. Дело в том, как вы его используете
7 мин

AI не делает вас тупее. Дело в том, как вы его используете

Полтора года назад я написал заметку в личном блоге о том, что замечаю в работе коллег и в своей собственной: чем больше доверяешь AI, тем реже задаёшь себе вопрос «а это точно правильно?». Я тогда опирался на исследование Microsoft – оно показывало, что доверие к AI подавляет критическую оценку выдаваемых ответов. Аргумент казался мне сильным, но у него был очевидный изъян: корреляция, а не причинно-следственная связь.

В феврале 2026 года исследователи Anthropic Джуди Шэнь и Алекс Тамкин опубликовали эксперимент, который закрыл этот пробел. Рандомизированный контроль. Конкретные данные. И вывод, который, как мне кажется, неправильно понимают большинство людей, кто о нём читал.

Потому что это не история о том, что AI делает нас глупее. Это история о том, как именно мы его используем.

KazLLM и суверенный AI: гид для госслужащего Казахстана
11 мин

KazLLM и суверенный AI: гид для госслужащего Казахстана

11 февраля 2026 года на заседании правительства президент Токаев публично раскритиковал KazLLM. Модель, запущенную с большой помпой в декабре 2024-го, используют лишь 600 тысяч человек – 3% населения страны. Для сравнения: ChatGPT в Казахстане пользуются 2,6 миллиона человек. Президент был прямолинеен: KazLLM «не может конкурировать с ChatGPT».

Это заявление ставит вопрос ребром. Зачем Казахстану собственная языковая модель, если глобальные решения работают лучше? И если суверенный AI необходим – почему он проигрывает?

Ответ сложнее, чем кажется. Потому что KazLLM – это не «казахский ChatGPT». Это совершенно другой инструмент с другой задачей. И сравнивать их – всё равно что сравнивать национальную электростанцию с импортным бытовым прибором.

Зачем учить AI на курсах, если всё есть в ChatGPT: разбор по науке
10 мин

Зачем учить AI на курсах, если всё есть в ChatGPT: разбор по науке

“Зачем мне ваши курсы, если я могу просто спросить ChatGPT?”

Этот вопрос звучит в комментариях под каждым постом об обучении AI. Логика железная: интернет бесплатный, ChatGPT объяснит что угодно, YouTube полон туториалов. Зачем платить за курс, если вся информация уже доступна?

Вопрос отличный. Ответ на него – не тот, который ожидают услышать.

Потому что между “иметь доступ к информации” и “уметь с ней работать” – пропасть. Доступ к медицинским справочникам не делает вас врачом. Наличие кухонного ножа не делает вас шеф-поваром. А возможность задать вопрос ChatGPT не делает вас специалистом по AI. Как показывает исследование MIT о выборе, реальная сила специалиста – не в наличии инструмента, а в способности критически оценить то, что инструмент предлагает.

И это не просто красивая метафора – это подтверждённый исследованиями факт.

AI не ошибается системно – он просто хаотичен: исследование Anthropic
10 мин

AI не ошибается системно – он просто хаотичен: исследование Anthropic

Распространенный страх об искусственном интеллекте звучит так: AI начнет последовательно преследовать неправильные цели. Система оптимизации, которой дали не ту задачу, будет методично двигаться к ней, игнорируя человеческие ценности. Классический сценарий: AI-помощник менеджера, которому поручили “максимизировать производительность команды”, начнет систематически перегружать людей, потому что это технически увеличивает выработку.

Но исследователи Anthropic обнаружили другой паттерн. AI-системы не становятся последовательными злодеями с неправильными целями. Они становятся хаотичными – совершают ошибки, которые не вписываются ни в какую логическую схему. “Like a hot mess” – как выразились авторы исследования.

Удивительно, но чем дольше модель рассуждает, тем менее предсказуемыми становятся её ошибки. Это не про галлюцинации фактов – это про фундаментальную непоследовательность в принятии решений.

AI не экономит время – он его уплотняет: 8 месяцев наблюдений
11 мин

AI не экономит время – он его уплотняет: 8 месяцев наблюдений

Компании беспокоятся, как заставить сотрудников использовать AI. Обещание соблазнительное: AI возьмёт на себя рутину – черновики документов, суммаризацию информации, отладку кода, – освободит время для высокоценных задач.

Но готовы ли компании к тому, что произойдёт, если они в этом преуспеют?

Исследователи из Стэнфорда провели 8-месячное наблюдение за примерно 200 сотрудниками американской технологической компании, которая внедрила генеративный AI. Компания не требовала использовать AI принудительно, просто предоставила корпоративные подписки на коммерческие инструменты. Сотрудники сами решали, применять AI или нет.

Результат оказался парадоксальным. AI не сократил работу. Он её интенсифицировал. Работники стали работать быстрее, брать на себя больший объём задач, распространять работу на большее количество часов в день – часто без явных внешних требований. AI сделал “делать больше” возможным, доступным и во многих случаях внутренне награждающим.

Удивительно, но тот же паттерн прослеживается в других исследованиях. Microsoft обнаружил, что 62% продакт-менеджеров используют Gen AI ежедневно, но 81% говорят, что AI экономит время, при этом 56% отрицают, что усилий стало меньше. Парадокс? Нет, закономерность.