Почему ИИ решает задачи, которые не могут решить математики – и при чем здесь менеджеры

Представьте: вы решаете, стоит ли доверить ИИ-инструменту подготовку стратегического отчета для совета директоров. Модель уверенно генерирует 15 страниц анализа с графиками и выводами. Вы чувствуете легкое беспокойство – насколько можно доверять этим рекомендациям? Способна ли система на глубокий анализ, или это просто статистически правдоподобная имитация?
Недавно группа исследователей из Epoch AI выпустила бенчмарк FrontierMath: Open Problems – набор математических задач, которые профессиональные математики пытались решить и потерпели неудачу. На момент публикации ни один человек и ни одна ИИ-система не решили эти задачи. Если ИИ справится, это будет реальный вклад в человеческое знание.
Вопрос для менеджера: почему это важно для вашей работы?

Что такое FrontierMath и чем он отличается от обычных тестов
Большинство бенчмарков для ИИ построены на задачах с известными решениями. Модель учится на примерах, а затем применяет усвоенные паттерны. Это работает для школьной математики, перевода текстов или классификации изображений. Но это не показывает, способна ли система на настоящее концептуальное мышление – создание новых идей, а не комбинирование известных.
FrontierMath радикально отличается. В пилотной версии 14 задач из активной математической исследовательской работы. Каждая задача оценена по шкале значимости – от “умеренно интересный результат” до “крупного прорыва”. Важная особенность: предложенные решения можно проверить автоматически с помощью компьютерной программы, хотя само решение неизвестно.
Исследователи попросили математиков оценить, сколько специалистов пытались решить каждую задачу. Ответы варьировались от 2–4 математиков до 50–100. Время решения для наиболее способного эксперта, работающего полный рабочий день, оценивается от 1–4 недель до 3–10 лет. Человеческая планка установлена высоко.
Текущие результаты ИИ? Практически нулевые. GPT-5.2 Pro и Gemini 3 Deep Think справляются с упрощенными вариантами задач, где решения известны – это подтверждает понимание инструкций. Но на реальных открытых проблемах модели “не показывают особых перспектив”. Иногда они пытаются применять оптимизацию вместо необходимых концептуальных подходов. Иногда распознают задачу как открытую и просто сдаются.

Примеры задач – от графов до узлов
Давайте рассмотрим конкретные примеры, чтобы почувствовать уровень сложности.
Задача 1: Числа Рамсея для треугольных графов-книг (Комбинаторика)
Для заданного числа n постройте граф, показывающий, что число Рамсея R(B_n, B_n) больше определенного значения. Треугольный граф-книга B_n – это граф на n вершинах специальной конфигурации. Числа Рамсея изучают, сколько нужно элементов в структуре, чтобы гарантированно появился определенный паттерн.
Математик Уильям Уэсли из Калифорнийского университета оценивает это как “умеренно интересный результат”. Общая конструкция для таких графов была бы полезна вычислительным теоретикам графов и применима для доказательства границ других чисел Рамсея.
Задача 2: Поверхности дель Пеццо с KLT-особенностями (Алгебраическая геометрия)
Постройте семейство явных нормальных проективных KLT поверхностей дель Пеццо над алгебраически замкнутым полем характеристики 3 с числом Пикара 1 и произвольно большим количеством сингулярных точек.
Профессор Паоло Каскини из University College London оценивает это как “солидный результат”. Конструкция в характеристике 3 раскрыла бы новое явление в малых характеристиках и имела бы значение для более широкой программы понимания многообразий Фано.
Задача 3: Обратная задача Галуа (Теория чисел)
Найдите полином степени 23 в Q[x], чье поле разложения над Q имеет группу Галуа M23 (группа Матье). Обратная задача Галуа – один из базовых открытых вопросов в теории чисел, спрашивающий о конструкции полиномов с заданными симметриями.
Ассистент-профессор Дэниэл Литт из Университета Торонто оценивает это как “крупное продвижение”. Это минимальный случай, для которого проблема остается открытой – особенно интересный, потому что это последняя из спорадических простых групп, для которой неизвестна конструкция.
Задача 4: Алгоритм для числа развязывания узлов (Топология)
Создайте алгоритм, который принимает узел как входные данные и определяет, равно ли число развязывания (unknotting number) этого узла единице. Число развязывания показывает минимальное количество пересечений, которые нужно изменить, чтобы превратить узел в тривиальный.
Профессор Джоэл Хасс из Калифорнийского университета оценивает это как “прорыв”. Это один из фундаментальных вопросов в маломерной топологии, задающий базовый вопрос о том, насколько сложно тривиализовать узел. Решение было бы крупным результатом в теории узлов.
Ключевое замечание: эти задачи не придуманы для того, чтобы быть сложными для ИИ. Это реальные проблемы, интересные математикам на их собственных условиях – ядро исследовательской математики.
Связь между абстрактной математикой и управленческими навыками
Возникает законный вопрос: при чем здесь управление проектами, команды и принятие бизнес-решений? Разве менеджер должен разбираться в числах Рамсея?
Конечно, нет. Но способность решать открытые математические задачи говорит о нескольких критических навыках, которые напрямую относятся к управленческой работе.
Математики и менеджеры одинаково нуждаются в распознавании паттернов в неструктурированных данных. Когда математик смотрит на открытую задачу, ему нужно увидеть скрытую структуру, которую другие не заметили. Аналогично, менеджер сталкивается с хаотичными рыночными данными, противоречивыми отзывами клиентов, неясными стратегическими сигналами. Способность увидеть паттерн там, где другие видят шум – это то, что отличает стратегическое мышление от тактического исполнения.
Оба направления требуют декомпозиции сложных проблем. Математики разбивают монументальные задачи на подзадачи, определяют ключевые леммы, строят промежуточные конструкции. Менеджеры делают то же самое при запуске продукта, реорганизации департамента или входе на новый рынок. Если ИИ способен на такую декомпозицию в математике, он может применить это к бизнес-проблемам.
Критический навык обеих профессий – “исследовательский вкус”, способность выбрать правильное направление. Математики развивают интуицию, какие подходы перспективны, а какие ведут в тупик. Они замечают правильные паттерны, выбирают продуктивные направления. Менеджеры тоже постоянно делают суждения без полной информации – какую технологию внедрять, какой найм приоритизировать, куда вкладывать ресурсы. Исследователи FrontierMath отмечают, что решение этих задач означало бы движение к “сверхчеловеческому исследовательскому вкусу” в целом.
Фундаментальное различие – концептуальное мышление против перебора. Задачи FrontierMath специально выбраны так, что грубая сила не работает. Даже с суперкомпьютером простой перебор вариантов не даст решения – нужен концептуальный прорыв. В менеджменте это различие тоже критично. Можно перебирать тактики маркетинга методом проб и ошибок, а можно понять фундаментальную причину, почему клиенты уходят.
Стоит признать: математика может быть “необычно легкой” для ИИ из-за формальной природы. Возможно, успех в математике не гарантирует успех в размытых, политически заряженных бизнес-контекстах. Но если ИИ не может справиться с формальными проблемами, где правила четкие, стоит ли доверять ему стратегические решения, где правил нет вообще?
Получите 3 бесплатных урока по AI для менеджеров
Без платёжных данных • Доступ сразу после регистрации

Практические следствия для менеджеров
Что это означает для повседневных управленческих решений?
Рассмотрим решения о найме с участием ИИ. Многие компании используют ИИ для скрининга резюме, оценки кандидатов или даже проведения первичных интервью. Результаты FrontierMath показывают: современные модели отлично справляются с задачами, где известны паттерны (упрощенные варианты математических задач), но терпят неудачу на новых, концептуальных вызовах. Аналогично, ИИ-рекрутинг хорош для фильтрации по известным критериям, но может пропустить нестандартных кандидатов с нетипичным опытом, которые принесли бы прорывные идеи.
Второй аспект – доверие к ИИ-рекомендациям. Когда модель генерирует стратегический отчет или инвестиционную рекомендацию, она комбинирует существующие паттерны. Это полезно для инкрементальных решений, но рискованно для трансформационных выборов. Если ИИ не может решить математическую задачу, требующую концептуального скачка, он вряд ли предложит контринтуитивную стратегию, противоречащую всем известным кейсам.
Ключевая проблема – понимание реальных ограничений ИИ. Менеджеры часто переоценивают возможности ИИ из-за впечатляющей беглости языка. Модель пишет убедительно, использует правильную терминологию, ссылается на фреймворки. Но это не означает глубокое понимание. FrontierMath – это способ калибровки ожиданий. Если топовые модели не могут решить задачи, над которыми математики бились годами, возможно, стоит перепроверить бизнес-анализ, сгенерированный за 30 секунд.
Наконец, рассмотрим будущее управленческих навыков в контексте развития ИИ. Если ИИ начнет решать задачи уровня FrontierMath, это будет сигналом качественного сдвига. Тогда ценность менеджера сместится от аналитических способностей к чисто человеческим навыкам – построению доверия, эмоциональному интеллекту, этическим суждениям, политической навигации. Пока этого не произошло, аналитическое мышление остается защитой от автоматизации.
Важное замечание: бенчмарк введет смещение выборки. Задачи FrontierMath выбираны так, чтобы решения можно было проверить автоматически. Это создает уклон в сторону относительно конкретных, формальных проблем. Возможно, ИИ окажется уникально приспособлен именно для таких задач, и прогресс не обобщится на другие области математики – и уж тем более на менеджмент.
Хотите освоить AI системно?
Бесплатный модуль из 3 уроков специально для менеджеров. Без теории – только практика, которая даст результат уже на первой неделе.
Что делать менеджеру с этой информацией
Не бросайтесь изучать алгебраическую геометрию. Вместо этого:
Первое действие – калибровка ожиданий от ИИ. Когда инструмент предлагает решение сложной проблемы, спросите себя: это комбинация известных паттернов или концептуальный прорыв? Если второе, проверьте особенно тщательно. Пока ИИ не решает задачи уровня FrontierMath, относитесь к его стратегическим рекомендациям с здоровым скептицизмом.
Второе направление – развитие навыков, которые ИИ пока не освоил. Концептуальное мышление, “исследовательский вкус”, способность видеть непаттернизуемые связи – это то, что пока остается за человеком. Инвестируйте время в глубокое понимание проблем, а не в поверхностное освоение инструментов.
Практическое правило – различать типы задач для делегирования ИИ. Если задача похожа на известные примеры (написание типового отчета, анализ стандартных метрик), ИИ справится отлично. Если требуется концептуальный скачок (новая бизнес-модель, нестандартная стратегия выхода из кризиса), держите контроль у себя.
Наконец, важно следить за прогрессом бенчмарков. Когда первая задача FrontierMath будет решена, это станет сигналом. Каждое решение – это калибровочная точка для оценки, насколько близко ИИ подобрался к человеческому (или сверхчеловеческому) концептуальному мышлению.
Провокационное заключение
Возможно, математические способности ИИ – это просто метрика для технических энтузиастов, не имеющая отношения к реальной работе. В конце концов, сколько менеджеров в вашей карьере решали задачи топологии?
Однако базовые когнитивные способности – распознавание паттернов, декомпозиция проблем, концептуальные скачки – универсальны. Если ИИ не может их продемонстрировать в формальной, проверяемой области математики, стоит ли предполагать, что он обладает ими в расплывчатой области бизнеса?
FrontierMath – это не тест на математику. Это тест на фундаментальную способность мыслить концептуально, видеть то, чего не видят другие, делать прорывы там, где перебор не работает. Это именно те навыки, которые отличают стратега от исполнителя, лидера от менеджера, визионера от администратора.
Пока ИИ не решил ни одной задачи. Это не повод отказаться от инструментов – это повод понимать их место. Они превосходны для паттернов. Для прорывов пока нужен человек.
Источники
- FrontierMath: Open Problems – Epoch AI, официальная документация бенчмарка
- FrontierMath Technical Paper – Подробное описание методологии и результатов тестирования