Дайджест #15: $1,87 за анализ SpaceX – или $800 в день за ошибку

#15
6 мин чтения

AI-агент написал инвестиционный меморандум за 12 минут и $1,87. Claude обошёл ChatGPT в корпоративном секторе. Coinbase автоматизировал 55% комплаенса.

В этом выпуске – почему AI-агент за $1,87 заменяет подписку Bloomberg за $24 000 (но может стоить $800 в день при неправильной настройке), как Claude впервые обошёл ChatGPT в корпоративном секторе, и что происходит, когда AI берёт на себя 55% расследований по фроду.

За последние две недели мы опубликовали серию практических руководств: как внедрить ИИ в работу IT-команды, как внедрить ИИ на производстве и как выжать максимум из GigaChat. Если планируете или ведёте пилот – начните с них.


$1,87 за инвестиционный анализ – и $800 в день за ошибку

Экономика AI-агентов: цифры, которые противоречат друг другу

Начну с данных, а не с хайпа. Исследование, сравнившее AI-агентов и людей на реальных рабочих задачах, показало: агенты выполняют структурированные операции на 88% быстрее и на 90–96% дешевле. Forrester TEI подтверждает на конкретных процессах: обработка обращений в поддержке – $0,46 за агента против $4,18 за человека (разница в 9 раз), код-ревью – $0,72 против $48 (в 66 раз).

На прошлой неделе эти цифры получили яркую иллюстрацию. Продакт-лид Coinbase Ник Принс показал, как AI-агент проанализировал S-1 файлинг SpaceX – 226 мегабайт – и написал инвестиционный меморандум за 12 минут и $1,87. Это демо, а не рецензированный аудит – качество меморандума никто публично не верифицировал. Но порядок величин показателен: терминал Bloomberg для похожих задач стоит $24 000 в год.

Так AI-агенты дешевле людей? Зависит от задачи.

Fortune на той же неделе опубликовал данные с обратным выводом: AI обходится компаниям дороже, чем сотрудники. Вице-президент Nvidia Брайан Катанцаро прямо сказал: «Стоимость вычислений значительно превышает стоимость сотрудников». Gartner объясняет механику: агентные модели потребляют на порядки больше токенов на задачу, и рост потребления опережает падение цен. BCG добавляет контекст: только 5–12% компаний получают реальную отдачу от AI, остальные 60% отчитываются о минимальном или нулевом эффекте.

Оба вывода верны одновременно. Структурированная задача «прочитай документ и синтезируй отчёт» – агент в десятки раз дешевле. Замена целого отдела с его контекстом и суждениями – счёт за токены растёт экспоненциально.

И ещё одна цифра: $800 в день. Столько может стоить некорректно настроенный агент, который зацикливается в петле опроса статуса. Контекстное окно раздувается, токены сгорают, задача не продвигается. Как принтер, который печатает пустые страницы на выходных – только каждая страница стоит десятки долларов.

Вывод: экономика агентов работает, но только при правильной постановке задачи и архитектурном контроле. Без этого – дороже людей. Мы разбирали эту экономику в деталях в исследовании AI-моделей – там видно, что дорого ≠ хорошо.

Стоимость vs качество AI-моделей: дорого ≠ хорошо

Исследование: AI vs человек · Fortune: AI дороже сотрудников · BCG: 5–12% получают отдачу


Claude впервые обошёл ChatGPT в корпоративном секторе

34,4% против 32,3% – и что за этим стоит

Тихий переворот, который легко пропустить за шумом больших анонсов. По данным Ramp AI Index (май 2026, данные по 50 000 компаний в США), Claude (Anthropic) впервые обогнал ChatGPT по доле корпоративных внедрений: 34,4% компаний платят за Claude, 32,3% – за ChatGPT.

Ramp AI Index: Anthropic 34,4% vs OpenAI 32,3% – первое пересечение графиков

За последний год Anthropic увеличила базу корпоративных клиентов в четыре раза. Рост OpenAI за тот же период – 0,3%. Разница – порядки.

Причины, которые я вижу: Claude лучше работает с длинными документами и аналитическими задачами – именно то, что нужно в финтехе и крупном бизнесе. Плюс подход Anthropic к безопасности данных, который для корпоративных закупок часто важнее скорости.

На прошлой неделе Anthropic сделала ещё один ход – запустила Claude for Small Business: 15 готовых агентных рабочих процессов с интеграциями в QuickBooks, PayPal, HubSpot и Canva. Модель сама рассчитывает зарплаты, закрывает месяц и готовит пакет документов для бухгалтера. Каждое действие – только с одобрения владельца.

Claude for Small Business: расчёт зарплат и закрытие месяца

Мне кажется, это правильный стратегический ход. Вместо «попробуйте AI для чего-нибудь» – конкретные рабочие процессы с конкретными интеграциями. Менеджеру малого бизнеса не нужен промпт-инжиниринг, ему нужно закрыть месяц и свести кассу.

Ramp AI Index · Claude for Small Business


Coinbase автоматизировал 55% расследований по фроду

Когда AI берёт на себя комплаенс – и что может пойти не так

Coinbase перестроил систему комплаенса вокруг AI-агентов. Теперь алгоритмы самостоятельно обрабатывают 55% всех кейсов по фроду в США. Одновременно компания сократила около 700 сотрудников (14% штата), а оставшихся реорганизовала в «AI-native поды» – маленькие команды, работающие в связке с автоматизированными системами.

Важная оговорка: ни один финансовый регулятор в США пока официально не одобрил AI-driven комплаенс как замену человеческой проверке. Coinbase проводит эксперимент в реальном времени.

Это пересекается с трендом, который мне кажется недооценённым. Исследователи описывают феномен «киборгизации»: когда сотрудники плотно работают с AI, они начинают слепо доверять его выдаче. Скорость растёт, критическое мышление падает. Галлюцинации проскакивают мимо перегруженного внимания.

16% Frontier Professionals vs 84% остальных – разрыв в использовании AI

В спецвыпуске #14 мы подробно разбирали эту проблему через данные Microsoft WTI: 50% сотрудников назвали контроль качества AI-выхода главным навыком будущего. Coinbase – первый крупный кейс, где автоматизация комплаенса дошла до 55%. Вопрос не в том, работает ли это. Вопрос – кто поймает ошибку, когда больше половины решений принимает машина.

Coinbase AI compliance · Cyborg uplift studies


Идеи и ссылки

Grok Build: лендинг за 40 секунд. xAI выпустила Grok Build 0.1 – кодинг-агент, который генерирует полноценные лендинги за 40 секунд и стоит $1 за миллион токенов. Для быстрой проверки гипотезы – самый дешёвый вариант прототипирования прямо сейчас.

Intercom Fin автоматизирует 64% обращений в финсекторе. Финансовая группа MONY (MoneySuperMarket, Quidco) развернула AI-агента Intercom Fin для чата и email. 64% запросов решаются без человека в регулируемом секторе – достойный ориентир для тех, кто оценивает AI-поддержку.

95% онлайн-магазинов видят трафик от ботов – но только 20% к нему готовы. Боты не смотрят на дизайн, их интересует JSON. PYMNTS составил чеклист: структурированные данные, цены через API, условия доставки в машиночитаемом формате.

$200+ на сотрудника – новая формула AI-бюджета. Эксперты рекомендуют сопоставлять расходы на AI-токены со стоимостью аренды офиса. Если аренда рабочего места обходится в $500–1 000 в месяц, а $200 на AI-подписки удваивает продуктивность – это лучшая инвестиция в портфеле.

Менеджер как Team Lead для AI-агентов. Формула 80/20: 80% рутины выполняет агент, 20% – контроль и архитектура. Звучит как обычное делегирование, но с одним отличием – агенту не нужно объяснять, зачем это делается. Ему нужна чёткая спецификация.

37% используют AI дома – и только 23% на работе. Разрыв вызван не отсутствием доступа, а отсутствием навыков для рабочих задач. Аудит навыков команды может быть полезнее покупки очередной лицензии.


Из нашего блога

Как внедрить ИИ в работу команды: пошаговый план – 5 шагов от выбора задачи до измерения результата. Ошибки 95% компаний и чек-лист на 30 дней.

Как внедрить ИИ на производстве – кейсы СИБУР, Северсталь и ГК Цифра. Для руководителей заводов и производственных менеджеров.

GigaChat для работы: как выжать максимум – промпт-техники с 20–30% улучшением и честная граница возможностей.

Срыв сроков строительства: 5 причин, видных в данных – как увидеть проблему в данных 1С за две недели до планёрки. С готовыми промптами для ChatGPT.

Обновление бенчмарка. Добавили в бенчмарк свежие модели – Qwen 3.7 Max (Alibaba) и Gemini 3.5 Flash (Google). А главное – появилась страница сравнения двух моделей бок о бок. Паутинка по 8 категориям менеджерских задач, разбивка по подкритериям, доступность из России. Полезно перед оплатой подписки – сразу видно, где разница реальна, а где переплата не оправдана.