Sber

40 casos de GigaChat: contrastamos las cifras de Sber con un benchmark

26 min de lectura

Sber, el mayor banco de Rusia y dueño del modelo GigaChat, lanzó un especial publicitario: cuarenta casos de empresas que adoptaron GigaChat y cuentan los resultados. EdTech, MedTech, HRTech, ciberseguridad, PropTech. Tarjetas bonitas, cifras concretas, startups reales.

Especial publicitario de Sber

En la imagen: la diapositiva «Un paso por delante» de la aceleradora Sber500×GigaChat – 40 startups en 9 sectores. Efectos declarados: procesos hasta x16 más rápidos, costes hasta un 90 % menores, automatización de tareas hasta el 95 %, ingresos hasta un 30 % mayores.

Nosotros tenemos un benchmark: 29 modelos, 4308 evaluaciones independientes sobre tareas de gestión. GigaChat ocupa el último puesto, el 29, tras la segunda ola de pruebas. Eso crea una situación interesante.

No porque Sber mienta. Los casos son reales, las startups existen, la automatización funciona. La pregunta es otra: ¿era el modelo óptimo para las tareas que estaban resolviendo?

Leer más
40 casos de GigaChat: contrastamos las cifras de Sber con un benchmark
GigaChat Ultra Thinking: piensa mas tiempo – responde peor?
8 min

GigaChat Ultra Thinking: piensa mas tiempo – responde peor?

GigaChat Ultra Thinking piensa mas tiempo y consume mas recursos computacionales. Las tareas de gestion las resuelve un 3,3% peor que la version sin razonamiento. Esto no es un error ni una casualidad – es un patron documentado por trabajos academicos durante los ultimos dos anos.

Esta semana, Sber presento GigaChat Ultra – su nuevo modelo insignia con modo de razonamiento (Thinking). El modelo esta disponible de forma gratuita en la version web, aplicaciones moviles y a traves del bot de Telegram. Anadimos inmediatamente ambas variantes a nuestra investigacion de modelos de IA para gestores: los evaluamos en los 32 escenarios siguiendo la metodologia unificada, los calificamos con ambos jueces LLM y los comparamos con los otros 52 modelos.