Mistral AI Mistral AI Tier: Average Russia access: OpenRouter

Mistral Medium 3.5

Уверенный эксперт, который выдумывает законы – и звучит убедительно

Платите в 20 раз больше, чем за соседку Gemma 4 31B при одинаковом итоговом балле – 7.19 против 7.20. Единственное оправдание: в аналитике и сценарном планировании Mistral реально силён, но стоит только добавить цифру или закон – и модель начинает выдумывать с профессорским видом.

Overall rank
#23
Overall score
6.86/10
Cost per question
$1.50
per 1M tokens · ≈ 750 pages
Cost per answer
$7.50
per 1M tokens · ≈ 750 pages

Profile across 8 categories

0–10 scale. Higher means the model handled those tasks better

chart
Strong at
Analysis & Decisions
7.50/10
Weak at
Regional Awareness
5.70/10
Best for
  • + Подготовка сценарного анализа и матриц решений для стратегических совещаний – структура ответов близка к экспертному уровню
  • + Скрипты трудных разговоров с командой: увольнение, снижение бонуса, конфликт – здесь модель выдаёт детальные и реалистичные диалоги
  • + Черновики аналитических записок для внутреннего обсуждения, где итоговые факты всё равно проверяются вручную
Not for
  • Любой вопрос по ТК РФ, налогам или трудовым спорам – назовёт несуществующие статьи с интонацией юриста
  • Подготовка материалов для руководства со ссылками на отчёты и исследования – выдумает источники, которых не существует
  • Задачи с жёсткими дедлайнами и конкретными цифрами: перепутает даты, сроки и суммы, не предупредив об этом
Benchmark task – run and compare
Analysis & Decisions – 7.50/10

This is a real prompt from our benchmark. Hit "Run" – the model answers right here so you can compare with the competitor.

You
Я могу инвестировать 80 000 долларов в автоматизацию [процесса: например, "процесс ежемесячной отчетности"]. Что я знаю: - Текущий процесс занимает 3 человека × 2 дня/месяц = 48 часов/месяц - Автоматизация сократит это до 4 часов/месяц (заявление вендора, не проверено) - Внедрение займет 3 месяца и потребует 20% времени одного разработчика - Риск: Процесс может измениться при следующей реорганизации (по слухам, через 6-12 месяцев) - Команда скептически настроена после неудачного проекта автоматизации в прошлом году Чего я не знаю: - Точная экономия времени (заявления вендоров разнятся) - Скрытые затраты на обслуживание - Влияние на качество данных - Будет ли процесс существовать после реорганизации Пожалуйста: 1. Порекомендуй, стоит ли инвестировать, и если да, то при каких условиях. 2. Предложи, как структурировать пилотный или поэтапный подход. 3. Определи точку безубыточности и срок окупаемости. 4. Порекомендуй, как управлять скептицизмом команды. 5. Предложи критерии принятия решения для раннего закрытия проекта, если он не работает.
Comparing:
mistral-medium-3-5 · gemini-3-flash-preview

Same model – two results

experiment, 1,700 runs
Typical prompt

Выручка упала на 18%, трафик вырос на 12%, средний чек снизился с 8700 до 6200. Что происходит и что делать?

6.8 /10
Structured prompt

...Формат:

  • § Диагноз (2-3 предложения)
  • § Корневые причины (что + почему + данные)
  • § Рекомендации (действие, результат в цифрах, срок, ответственный)
  • § Чего я не знаю
8.6 /10 +24%

A naive prompt gets generic advice. A structured one – causal analysis with numbers and deadlines.

About this experiment →

Category breakdown

Russia availability

Via OpenRouter

Warning: regional specifics

В ходе оценки модель называла несуществующие статьи ТК РФ, путала налоговые ставки и цитировала выдуманные нормативные акты – при этом без малейшей оговорки о неуверенности. Любой вывод о российском праве или регуляторике требует обязательной проверки в первоисточнике.

Related articles

Data analysis isn't about the model

The prompt determines 70% of the result. The Analysis & Decisions with AI module has 6 analysis frameworks with ready-to-use prompts: from revenue diagnostics to root cause analysis.

See the frameworks →