Дайджест #13: Stanford AI Index 2026 – 88% внедрили AI, 62% застряли на старте

В этом выпуске – Stanford AI Index 2026: почему 88% внедрения не равно 88% пользы, как инференс подешевел в 280 раз, и что Coinbase только что сделал с менеджерами среднего звена.

Но сначала – обновление. Мы переработали страницу бенчмарка – теперь на mysummit.school/research/benchmark обновлённая методология, актуальные результаты и удобная навигация по категориям задач. Если вы принимаете решения о том, какую модель использовать в команде – это самый компактный способ сравнить варианты.

Обновленный Benchmark от mysummit.school

А чтобы не пропускать обновления между дайджестами – подписывайтесь на наш Telegram-канал.

Stanford AI Index 2026: пять сюжетов для менеджера

AI обогнал интернет – но 62% застряли на старте

В апреле Stanford HAI выпустил девятый ежегодный AI Index Report – самую масштабную сводку о состоянии индустрии. Вот что из 380 страниц стоит знать.

Генеративный ИИ достиг 53% охвата населения за три года. Персональному компьютеру понадобилось 15 лет, интернету – около десяти. Корпоративное внедрение выросло с 78% до 88% за год. Частные инвестиции – с $109 до $286 млрд. Четыре из пяти студентов используют GenAI в учёбе.

Внедрение AI в организациях: рост с 20% в 2017 до 88% в 2025

Но за этими цифрами – парадокс. Данные Epoch AI показывают: 62% пользователей AI применяют его на уровне «одна-две быстрые задачи». Только 5,6% опираются на AI всерьёз – регулярно, глубоко, для ключевых рабочих процессов.

Мне кажется, это центральная история 2026 года. Открыть ChatGPT и задать вопрос может каждый. Перестроить под него рабочий процесс – совсем другая задача. Этот разрыв – вопрос навыков, и деньгами его не закроешь.

Стадия внедрения AI по выручке организации: только 3–10% достигли полного масштабирования

Даже среди компаний с выручкой более $5 млрд «полностью внедрили» AI лишь 10%. У компаний поменьше – 3–5%. Остальные застряли на стадии экспериментов и пилотов.

А вот деталь, которую легко пропустить: занятость среди американских разработчиков 22–25 лет снизилась на 20% с 2022 года. AI берёт на себя задачи, на которых джуниоры раньше учились и росли. Тот же тренд – в службах поддержки.

Динамика занятости по возрастным группам: группа 22–25 лет теряет 20% с 2022 года

Производительность команды растёт за счёт AI, но конвейер подготовки новых кадров сужается. Кто станет сеньором через пять лет, если джуниорам всё сложнее попасть в профессию?

280x дешевле – и это меняет расчёт ROI

Стоимость инференса моделей уровня GPT-3.5 (не удивляйтесь старой модели, это взято для сравнения, яблоки сравниваем с яблоками) упала в 280 раз с момента выхода ChatGPT. Качество при этом сопоставимо – дешевеет сам инференс (инференс – ответ от LLM) при сохранении уровня моделей.

В прошлом дайджесте мы показали на данных нашего бенчмарка: разница в цене между моделями – три порядка величины, а в качестве – 0,24 балла. Stanford AI Index подтверждает этот тренд на макроуровне: инференс дешевеет экспоненциально, а вычислительная мощность растёт в 3,3 раза ежегодно.

Потребительская ценность GenAI-инструментов – $172 млрд в год для американских пользователей. Но есть обратная сторона: экологический след. Тренировка GPT-5 произвела, по оценкам, около 11 500 тонн CO₂ – столько же выбрасывают 2 500 автомобилей за год. Одна модель = небольшой город на колёсах. Эту стоимость масштабирования редко закладывают в ROI-модели.

Если вы до сих пор платите за премиум-модель «потому что дороже – значит лучше» – перечитайте нашу статью о моделях.

Coinbase: AI сжимает менеджмент

Coinbase сократил 14% штата – 700 человек. Само сокращение – обычная корпоративная история. Интересно обоснование: CEO Брайан Армстронг прямо связал его с AI. «То, чего может достичь маленькая, сфокусированная команда, изменилось до неузнаваемости».

Coinbase заменяет «чистых менеджеров» на «player-coaches» – людей, которые и управляют, и работают руками. Максимум 5 уровней управления. AI-native pods – команды из одного человека, управляющего агентами, которые заменяют инженеров, дизайнеров и продактов.

Честно говоря, это первый прецедент, когда публичная компания напрямую говорит: «AI делает средний менеджмент избыточным». Klarna делала похожее, но масштабировала через AI поддержку клиентов. Coinbase – убирает слои управления.

Какие из ваших функций связаны с передачей информации вверх-вниз? Координация, контроль статусов – именно эти задачи AI автоматизирует первыми. Если ваша ценность – в маршрутизации информации, а не в экспертизе, это тревожный сигнал.

[Fortune] · [CNBC]

Mozilla нашла 271 уязвимость в Firefox за один проход – с помощью Claude

Mozilla получила ранний доступ к Claude Mythos Preview и натравила его на кодовую базу Firefox – почти 6 000 файлов на C++. Результат: 271 подтверждённая уязвимость в одном релизе (Firefox 150). Для сравнения: среднемесячная норма за 2025 год – около 21 бага.

180 из 271 – уровня sec-high, то есть эксплуатируемые через обычное посещение вредоносной веб-страницы. Среди находок – критические уязвимости 15- и 20-летней давности.

Mozilla оговаривается, что элитный исследователь нашёл бы все эти баги – но один человек нашёл бы 5–10 за месяц, а Claude нашёл 271 за один проход. Людей это не заменяет, но экономику безопасности переворачивает.

Мы в Microsoft тоже получили доступ к Mythos – пока ограниченный круг людей. И это уже влияет на процессы: мы перестраиваемся на выпуск security-патчей в течение 24 часов. Когда AI находит 271 уязвимость за один проход, старый цикл «собрали, приоритизировали, запланировали на следующий спринт» перестаёт работать.

Если у вас в команде есть legacy-код (а он есть у всех) – это касается и вас. AI найдёт то, до чего у ваших безопасников руки не дойдут ещё три года. А значит, найдут и другие.

[Mozilla Hacks] · [Schneier on Security]

Если хотите спокойный разбор Mythos без хайпа – рекомендую видео Ивана Ямщикова. Ямщиков занимается именно языковыми моделями и объясняет происходящее внятнее большинства комментаторов.

Идеи и ссылки

Контекст гниёт. Точность нейросетей падает на десятки процентов по мере роста истории диалога – даже у топовых моделей. Практический вывод прост: не ведите один бесконечный тред. Создавайте новый чат для каждого подэтапа проекта. Если чувствуете, что модель начала «тупить» – скорее всего, дело не в модели, а в длине контекста.

AI-агенты получают кошельки. Две новости об одном тренде. Stripe запустил Link – цифровой кошелёк, через который AI-агенты могут платить от имени пользователя через OAuth. Google Cloud и Solana запустили Pay.sh – платформу для микроплатежей агентов через стейблкоины. Инфраструктура для автономных AI-агентов строится прямо сейчас. Пока это выглядит как эксперимент, но через год-два вопрос «у вашего агента есть бюджет?» может стать нормой.

Codex теперь в Chrome. OpenAI выпустил расширение Codex для Chrome – инструмент работает в фоновом режиме, автоматизируя повторяющиеся задачи в браузере: заполнение форм, сбор данных по вкладкам, взаимодействие с внутренними системами. 4 миллиона пользователей еженедельно – рост в 8 раз с начала года. Справедливости ради, Claude Code делает то же самое уже пару месяцев – OpenAI здесь догоняет, а не изобретает.

MLJAR Studio – AI-аналитика без облака. MLJAR Studio работает полностью локально: загружаете данные, задаёте вопросы на обычном языке, получаете Python-код, графики и дашборды. Никакие данные не уходят в облако. Для тех, кому политика безопасности запрещает загружать финансовые данные или персональные данные в ChatGPT – это рабочая альтернатива. $199 за бессрочную лицензию.

Зубчатый край: олимпиада – да, аналоговые часы – нет. AI берёт золото на математической олимпиаде, но определяет время по циферблату в 50% случаев. Экстраполировать успех AI из одной области на другую – ловушка. Каждый сценарий нужно тестировать отдельно, что мы и делаем в бенчмарке.

Смарт-роутер Franklin экономит до 89% на API. Franklin автоматически выбирает модель из 55+ доступных под конкретную задачу. Для простых запросов – дешёвая модель, для сложных – дорогая. Похоже на то, что мы рекомендовали в стратегии 80/20 из прошлого дайджеста, но в автоматическом режиме. Технически – это для команд с API-интеграцией, не для обычных пользователей.

Из нашего блога

Из практических материалов за последние две недели:

4 техники промптинга, проверенные на 7 моделях – готовые промпты с воркшопа для IIBA. Экономия токенов от 41% до 79%. Каждый промпт можно запустить прямо на странице.
Как я построил систему оценки резюме на AI-агенте – практический кейс: 18 JSON-файлов профиля, пять измерений оценки, агент как синтетический «первый читатель» резюме.
Бенчмарки ИИ теряют смысл – как тогда выбирать модель – Epoch AI показывает: бенчмарки насыщаются за месяцы. Что приходит им на смену.

Это был дайджест изменений в инструментах и в материалах нашей школы. Если вам интересно получать такие обновления каждые 2 недели, то подписывайтесь :)

Между дайджестами мы публикуем короткие новости и инсайты в Threads и Telegram – подписывайтесь, чтобы быть в курсе каждый день.

Станислав и команда mysummit

Дайджест #13: Stanford AI Index 2026 – 88% внедрили AI, 62% застряли на старте

Stanford AI Index 2026: пять сюжетов для менеджера

AI обогнал интернет – но 62% застряли на старте

280x дешевле – и это меняет расчёт ROI

Coinbase: AI сжимает менеджмент

Mozilla нашла 271 уязвимость в Firefox за один проход – с помощью Claude

Идеи и ссылки

Из нашего блога

Технические

Аналитические

Функциональные

Маркетинговые

Stanford AI Index 2026: пять сюжетов для менеджера

AI обогнал интернет – но 62% застряли на старте

280x дешевле – и это меняет расчёт ROI

Coinbase: AI сжимает менеджмент

Mozilla нашла 271 уязвимость в Firefox за один проход – с помощью Claude

Идеи и ссылки

Из нашего блога

⚙️ Настройки файлов cookie

Технические

Аналитические

Функциональные

Маркетинговые

Внимание!

Политика использования файлов cookie