4 tecnicas de prompting probadas en 7 modelos: guia del taller

35 min de lectura
Stanislav Belyaev
Stanislav Belyaev Engineering Leader en Microsoft
4 tecnicas de prompting probadas en 7 modelos: guia del taller

“Analiza el proyecto y dame recomendaciones” – un prompt, siete modelos, y GPT-5.4 produjo 2231 palabras de consejos vagos, mientras Claude Sonnet genero 11 frases elogiosas del tipo “excelente estructura presupuestaria”. Basto con reescribir la solicitud usando una estructura de cinco elementos – los siete modelos se ajustaron a 346–443 palabras, y los elogios desaparecieron. Ahorro de tokens: del 41% al 79% dependiendo del modelo.

Esto no es teoria. Son datos de un taller de “Prompt Engineering en la practica” que imparti en la conferencia IIBA. Un brief de proyecto, cuatro tecnicas, siete modelos, 28 ejecuciones – y $0.054 en total. Mas barato que un cafe de maquina.

A continuacion – las cuatro tecnicas con prompts listos para usar. Cada uno se puede ejecutar aqui mismo – pulse el boton y dos modelos ejecutaran el prompt sobre el mismo brief de proyecto. Los datos estan incluidos en cada prompt, no necesita copiar nada.

Video y materiales del taller (en ruso): hackmd.io/@belyaevstanislav/S1416ngRZg

El proyecto para los experimentos

Las cuatro tecnicas trabajaron con un mismo caso – “BonusPlus”, una aplicacion movil de fidelizacion para una cadena minorista de 340 tiendas. Presupuesto de 18 millones de rublos, 4 meses para el MVP, equipo subcontratado. En el brief se incluyeron deliberadamente 16 problemas: desde la compatibilidad no verificada con 1C hasta estadisticas de mercado dudosas y la ausencia de QA por parte del cliente.

El texto completo del brief esta incluido en cada prompt ejecutable a continuacion. En adelante hare referencia a problemas especificos del mismo.

Tecnica 1: Estructura del prompt – 5 elementos

La idea es simple: cualquier prompt funcional contiene cinco bloques – Rol, Contexto, Tarea, Restricciones, Formato. No es magia, sino un pliego de condiciones escrito para una maquina en lugar de un proveedor.

Prompt deficiente (como contraste)

Ejecutelo y vea que obtiene – un muro de texto sin estructura:

Pruébalo tú mismo
Prompt deficiente – sin estructura
Analiza este proyecto y dame recomendaciones. Brief del proyecto: Plataforma de fidelizacion "BonusPlus" Informacion general Cliente: OOO "RetailGrupp" – cadena de 340 tiendas de proximidad en el Distrito Federal Central de Rusia. Objetivo del proyecto: Desarrollo y lanzamiento de una aplicacion movil con programa de fidelizacion para aumentar el ticket medio y la frecuencia de compra. Presupuesto: 18 millones de rublos para 2025–2026. Plazo: MVP en 4 meses (para el 1 de septiembre de 2025), lanzamiento completo – para el 1 de diciembre de 2025. Contexto de mercado El mercado de programas de fidelizacion en Rusia crecio un 24% en 2025 (datos de NielsenIQ). Entre las cadenas de alimentacion, el 78% ya cuenta con aplicaciones con sistemas de bonificacion. Principales competidores: "Pyatyorochka" (X5), "Magnit", "VkusVill". El periodo medio de amortizacion de los programas de fidelizacion en retail es de 14 meses. Situacion actual - "RetailGrupp" no tiene aplicacion. Opera con tarjeta plastica de fidelizacion (1,2 millones de tarjetas emitidas). - Ticket medio: 870 rublos (datos del Q1 2025). - Frecuencia de compra: 3,2 veces por semana entre clientes fieles. - Departamento de TI: 3 personas (administrador de sistemas, programador 1C, especialista de soporte tecnico). - Infraestructura de servidores: on-premise (centro de datos propio en Tula). Objetivos del proyecto 1. Aplicacion movil (iOS + Android): tarjeta de bonificacion electronica, ofertas personalizadas basadas en historial de compras, notificaciones push sobre descuentos, geolocalizacion de la tienda mas cercana. 2. Plataforma backend: integracion con el software de caja (1C:Retail), procesamiento de bonificaciones en tiempo real, modulo analitico para marketing, API para integraciones con socios. 3. Migracion de datos: traslado de 1,2 millones de perfiles de clientes desde tarjetas plasticas, conservacion de bonificaciones acumuladas, vinculacion del historial de compras. Equipo del proyecto - Director de proyecto: Aleksei Sokolov (experiencia: 3 anos en proyectos de TI, anteriormente – sector bancario) - Desarrollo: equipo subcontratado "DigitalSoft" (8 personas: 2 iOS, 2 Android, 2 backend, 1 QA, 1 DevOps) - Diseno: freelancer (recomendacion de un conocido) - Marketing: responsable de marketing interno + agencia de promocion (presupuesto 4 millones) Resultados esperados (a 12 meses) - Instalaciones de la aplicacion: 0 -> 500 000 - Ticket medio: 870 rublos -> 1 050 rublos (+21%) - Frecuencia de compra: 3,2/sem. -> 3,8/sem. (+19%) - Porcentaje de compras con la aplicacion: 0% -> 35% - NPS: no medido -> 45+ Riesgos (segun la evaluacion del cliente) 1. Baja velocidad de carga en zonas rurales (30% de las tiendas estan en ciudades pequenas y pueblos). 2. Resistencia de los cajeros a la transicion al nuevo sistema. 3. Competencia con grandes cadenas por la atencion de los usuarios. Presupuesto - Desarrollo (subcontratacion): 9 000 000 rublos - Diseno y UX: 1 200 000 rublos - Infraestructura de servidores: 2 800 000 rublos - Marketing y promocion: 4 000 000 rublos - Gastos imprevistos: 1 000 000 rublos - Total: 18 000 000 rublos Supuestos clave - El equipo subcontratado estara asignado al proyecto full-time desde el 1 de mayo de 2025. - 1C:Retail soporta API para la integracion (no se ha verificado). - Los clientes con tarjeta plastica migraran a la aplicacion en un plazo de 6 meses. - La infraestructura de servidores soportara la carga de 500 000 usuarios.
Comparamos:
openai/gpt-5.4-nano · deepseek/deepseek-v3.2

Prompt estructurado

Ahora ejecute el mismo brief, pero con estructura. Compare la longitud y el contenido de las respuestas:

Pruébalo tú mismo
Prompt estructurado – 5 elementos
# ROL Eres un director de proyectos experimentado con 10 anos de experiencia en consultoria de TI. Tu enfoque: risk-first – primero buscas problemas, luego oportunidades. # CONTEXTO Necesito presentar a la direccion una evaluacion del proyecto en 2 horas. Necesito un analisis honesto, no una presentacion. # TAREA Analiza el brief del proyecto a continuacion. Identifica: 1. Los tres principales riesgos (con evaluacion de probabilidad: alta/media/baja) 2. Que esta omitido o es contradictorio en el brief 3. Que preguntas hacer al cliente ANTES de comenzar # RESTRICCIONES - NO elogies el proyecto – busca puntos debiles - NO propongas soluciones – solo diagnostico - Extension: maximo 400 palabras - Formato: tres secciones con vietas # DATOS Brief del proyecto: Plataforma de fidelizacion "BonusPlus" Informacion general Cliente: OOO "RetailGrupp" – cadena de 340 tiendas de proximidad en el Distrito Federal Central de Rusia. Objetivo del proyecto: Desarrollo y lanzamiento de una aplicacion movil con programa de fidelizacion para aumentar el ticket medio y la frecuencia de compra. Presupuesto: 18 millones de rublos para 2025–2026. Plazo: MVP en 4 meses (para el 1 de septiembre de 2025), lanzamiento completo – para el 1 de diciembre de 2025. Contexto de mercado El mercado de programas de fidelizacion en Rusia crecio un 24% en 2025 (datos de NielsenIQ). Entre las cadenas de alimentacion, el 78% ya cuenta con aplicaciones con sistemas de bonificacion. Principales competidores: "Pyatyorochka" (X5), "Magnit", "VkusVill". El periodo medio de amortizacion de los programas de fidelizacion en retail es de 14 meses. Situacion actual - "RetailGrupp" no tiene aplicacion. Opera con tarjeta plastica de fidelizacion (1,2 millones de tarjetas emitidas). - Ticket medio: 870 rublos (datos del Q1 2025). - Frecuencia de compra: 3,2 veces por semana entre clientes fieles. - Departamento de TI: 3 personas (administrador de sistemas, programador 1C, especialista de soporte tecnico). - Infraestructura de servidores: on-premise (centro de datos propio en Tula). Objetivos del proyecto 1. Aplicacion movil (iOS + Android): tarjeta de bonificacion electronica, ofertas personalizadas basadas en historial de compras, notificaciones push sobre descuentos, geolocalizacion de la tienda mas cercana. 2. Plataforma backend: integracion con el software de caja (1C:Retail), procesamiento de bonificaciones en tiempo real, modulo analitico para marketing, API para integraciones con socios. 3. Migracion de datos: traslado de 1,2 millones de perfiles de clientes desde tarjetas plasticas, conservacion de bonificaciones acumuladas, vinculacion del historial de compras. Equipo del proyecto - Director de proyecto: Aleksei Sokolov (experiencia: 3 anos en proyectos de TI, anteriormente – sector bancario) - Desarrollo: equipo subcontratado "DigitalSoft" (8 personas: 2 iOS, 2 Android, 2 backend, 1 QA, 1 DevOps) - Diseno: freelancer (recomendacion de un conocido) - Marketing: responsable de marketing interno + agencia de promocion (presupuesto 4 millones) Resultados esperados (a 12 meses) - Instalaciones de la aplicacion: 0 -> 500 000 - Ticket medio: 870 rublos -> 1 050 rublos (+21%) - Frecuencia de compra: 3,2/sem. -> 3,8/sem. (+19%) - Porcentaje de compras con la aplicacion: 0% -> 35% - NPS: no medido -> 45+ Riesgos (segun la evaluacion del cliente) 1. Baja velocidad de carga en zonas rurales (30% de las tiendas estan en ciudades pequenas y pueblos). 2. Resistencia de los cajeros a la transicion al nuevo sistema. 3. Competencia con grandes cadenas por la atencion de los usuarios. Presupuesto - Desarrollo (subcontratacion): 9 000 000 rublos - Diseno y UX: 1 200 000 rublos - Infraestructura de servidores: 2 800 000 rublos - Marketing y promocion: 4 000 000 rublos - Gastos imprevistos: 1 000 000 rublos - Total: 18 000 000 rublos Supuestos clave - El equipo subcontratado estara asignado al proyecto full-time desde el 1 de mayo de 2025. - 1C:Retail soporta API para la integracion (no se ha verificado). - Los clientes con tarjeta plastica migraran a la aplicacion en un plazo de 6 meses. - La infraestructura de servidores soportara la carga de 500 000 usuarios.
Comparamos:
openai/gpt-5.4-nano · deepseek/deepseek-v3.2

Que sucedio

El prompt deficiente dio lo esperable: un muro de texto sin estructura. GPT-5.4 escribio 2231 palabras – cinco veces mas de lo necesario para una presentacion. Claude Sonnet incluyo 11 elogios a un proyecto en el que se habian incluido deliberadamente 16 problemas. DeepSeek V4 Flash simplemente parafraseo el brief de vuelta, agregando un par de frases genericas sobre “la necesidad de una planificacion cuidadosa”.

El prompt estructurado invirtio la situacion. Los siete modelos – desde GPT-5.4 hasta Gemma 4-26B – se ajustaron al rango de 346–443 palabras. Los elogios cayeron a 0–1 frases. Aparecieron riesgos concretos con probabilidades. Formato: tres secciones con vinetas, tal como se solicito.

Comparacion de resultados: prompt deficiente vs estructurado en 4 modelos

Por que funciona

La restriccion “NO elogies el proyecto” no es una peticion cortes, sino una instruccion que redirige la atencion del modelo. Sin ella, el modelo equilibra por defecto pros y contras – porque asi estan estructurados los datos con los que fue entrenado. La prohibicion explicita elimina ese ’equilibrio’ y libera tokens para el analisis.

Si le resultan familiares los 5 elementos del prompt, es la misma idea – solo que aqui con datos de validacion en siete modelos.

En nuestro experimento Make Weak Model Great Again el prompt estructurado vence al no estructurado en el 73–82% de los casos – en una muestra de mas de 1700 ejecuciones. Aqui, en el taller, las mismas 28 ejecuciones confirmaron el patron.

Tecnica 2: Few-Shot – muestre lo que quiere obtener

Few-Shot consiste en proporcionar al modelo dos o tres ejemplos del formato deseado directamente en el prompt. No se explica el formato con palabras, sino que se muestra una plantilla terminada.

Prompt

Pruébalo tú mismo
Few-Shot – dos ejemplos definen el formato
Extrae los riesgos del brief del proyecto. El formato de cada riesgo debe ser estrictamente como en los ejemplos a continuacion. Ejemplo 1: Riesgo: El desarrollador clave se va a mitad del proyecto Probabilidad: Media Consecuencia: Retraso de 3-6 semanas, perdida de expertise Indicador: El desarrollador comienza a actualizar LinkedIn, pide dias libres para entrevistas Mitigacion: Programacion en pares + documentacion de decisiones Ejemplo 2: Riesgo: El cliente cambia los requisitos despues de aprobar las especificaciones Probabilidad: Alta Consecuencia: Reelaboracion del 20-40% de lo realizado, aumento del presupuesto Indicador: El cliente dice "y tambien me gustaria..." despues de cada demo Mitigacion: Procedimiento de Change Request con evaluacion del costo de cada cambio Ahora extrae los riesgos de este brief (minimo 5): Brief del proyecto: Plataforma de fidelizacion "BonusPlus" Informacion general Cliente: OOO "RetailGrupp" – cadena de 340 tiendas de proximidad en el Distrito Federal Central de Rusia. Objetivo del proyecto: Desarrollo y lanzamiento de una aplicacion movil con programa de fidelizacion para aumentar el ticket medio y la frecuencia de compra. Presupuesto: 18 millones de rublos para 2025–2026. Plazo: MVP en 4 meses (para el 1 de septiembre de 2025), lanzamiento completo – para el 1 de diciembre de 2025. Contexto de mercado El mercado de programas de fidelizacion en Rusia crecio un 24% en 2025 (datos de NielsenIQ). Entre las cadenas de alimentacion, el 78% ya cuenta con aplicaciones con sistemas de bonificacion. Principales competidores: "Pyatyorochka" (X5), "Magnit", "VkusVill". El periodo medio de amortizacion de los programas de fidelizacion en retail es de 14 meses. Situacion actual - "RetailGrupp" no tiene aplicacion. Opera con tarjeta plastica de fidelizacion (1,2 millones de tarjetas emitidas). - Ticket medio: 870 rublos (datos del Q1 2025). - Frecuencia de compra: 3,2 veces por semana entre clientes fieles. - Departamento de TI: 3 personas (administrador de sistemas, programador 1C, especialista de soporte tecnico). - Infraestructura de servidores: on-premise (centro de datos propio en Tula). Objetivos del proyecto 1. Aplicacion movil (iOS + Android): tarjeta de bonificacion electronica, ofertas personalizadas basadas en historial de compras, notificaciones push sobre descuentos, geolocalizacion de la tienda mas cercana. 2. Plataforma backend: integracion con el software de caja (1C:Retail), procesamiento de bonificaciones en tiempo real, modulo analitico para marketing, API para integraciones con socios. 3. Migracion de datos: traslado de 1,2 millones de perfiles de clientes desde tarjetas plasticas, conservacion de bonificaciones acumuladas, vinculacion del historial de compras. Equipo del proyecto - Director de proyecto: Aleksei Sokolov (experiencia: 3 anos en proyectos de TI, anteriormente – sector bancario) - Desarrollo: equipo subcontratado "DigitalSoft" (8 personas: 2 iOS, 2 Android, 2 backend, 1 QA, 1 DevOps) - Diseno: freelancer (recomendacion de un conocido) - Marketing: responsable de marketing interno + agencia de promocion (presupuesto 4 millones) Resultados esperados (a 12 meses) - Instalaciones de la aplicacion: 0 -> 500 000 - Ticket medio: 870 rublos -> 1 050 rublos (+21%) - Frecuencia de compra: 3,2/sem. -> 3,8/sem. (+19%) - Porcentaje de compras con la aplicacion: 0% -> 35% - NPS: no medido -> 45+ Riesgos (segun la evaluacion del cliente) 1. Baja velocidad de carga en zonas rurales (30% de las tiendas estan en ciudades pequenas y pueblos). 2. Resistencia de los cajeros a la transicion al nuevo sistema. 3. Competencia con grandes cadenas por la atencion de los usuarios. Presupuesto - Desarrollo (subcontratacion): 9 000 000 rublos - Diseno y UX: 1 200 000 rublos - Infraestructura de servidores: 2 800 000 rublos - Marketing y promocion: 4 000 000 rublos - Gastos imprevistos: 1 000 000 rublos - Total: 18 000 000 rublos Supuestos clave - El equipo subcontratado estara asignado al proyecto full-time desde el 1 de mayo de 2025. - 1C:Retail soporta API para la integracion (no se ha verificado). - Los clientes con tarjeta plastica migraran a la aplicacion en un plazo de 6 meses. - La infraestructura de servidores soportara la carga de 500 000 usuarios.
Comparamos:
openai/gpt-5.4-nano · deepseek/deepseek-v3.2

Que sucedio

El 100% de los modelos produjo la respuesta en el formato exacto de cinco elementos. Los siete – incluyendo Gemma 4-26B y GPT-5.4 Nano, que en otras tecnicas confundian la estructura. La cantidad de riesgos identificados vario – de 5 en Nano a 12 en GPT-5.4 – pero el formato fue identico.

Esta es la tecnica mas potente para controlar el formato. Si necesita una plantilla concreta – informe, registro de riesgos, evaluacion – dos ejemplos funcionan mejor que dos parrafos de explicaciones.

Por que funciona

El modelo no aprende de sus instrucciones, sino de los patrones. Dos ejemplos crean un patron que es mas facil de seguir que una descripcion textual. Esto es especialmente critico para los modelos debiles: interpretan mal las instrucciones verbales complejas, pero copian la estructura con excelencia.

En los datos de nuestro experimento Few-Shot vence en el 75–89% de los casos. El porcentaje mas alto de las cuatro tecnicas.

Estructura, Few-Shot, XML-tags – tres tecnicas de este articulo se analizan en detalle en el modulo gratuito del curso. 9 tareas practicas de gestion, cualquier modelo.

Sin pago requerido • Notificación al lanzamiento

Unirse a la lista

Tecnica 3: XML-tags – datos separados de las instrucciones

Los XML-tags resuelven un problema concreto: cuando en el prompt conviven instrucciones y datos, el modelo confunde unas con otros. Los tags crean un limite claro – esto es lo que hay que hacer, esto es con lo que hay que trabajar.

Prompt

Pruébalo tú mismo
XML-tags – datos separados de las instrucciones
<role> Eres un controlador financiero. Verificas cifras, no estrategia. </role> <context> La empresa planifica un proyecto. El brief fue escrito por un gerente interesado en su aprobacion – por lo tanto, las cifras pueden ser optimistas. </context> <project_brief> Brief del proyecto: Plataforma de fidelizacion "BonusPlus" Informacion general Cliente: OOO "RetailGrupp" – cadena de 340 tiendas de proximidad en el Distrito Federal Central de Rusia. Objetivo del proyecto: Desarrollo y lanzamiento de una aplicacion movil con programa de fidelizacion para aumentar el ticket medio y la frecuencia de compra. Presupuesto: 18 millones de rublos para 2025–2026. Plazo: MVP en 4 meses (para el 1 de septiembre de 2025), lanzamiento completo – para el 1 de diciembre de 2025. Contexto de mercado El mercado de programas de fidelizacion en Rusia crecio un 24% en 2025 (datos de NielsenIQ). Entre las cadenas de alimentacion, el 78% ya cuenta con aplicaciones con sistemas de bonificacion. Principales competidores: "Pyatyorochka" (X5), "Magnit", "VkusVill". El periodo medio de amortizacion de los programas de fidelizacion en retail es de 14 meses. Situacion actual - "RetailGrupp" no tiene aplicacion. Opera con tarjeta plastica de fidelizacion (1,2 millones de tarjetas emitidas). - Ticket medio: 870 rublos (datos del Q1 2025). - Frecuencia de compra: 3,2 veces por semana entre clientes fieles. - Departamento de TI: 3 personas (administrador de sistemas, programador 1C, especialista de soporte tecnico). - Infraestructura de servidores: on-premise (centro de datos propio en Tula). Objetivos del proyecto 1. Aplicacion movil (iOS + Android): tarjeta de bonificacion electronica, ofertas personalizadas basadas en historial de compras, notificaciones push sobre descuentos, geolocalizacion de la tienda mas cercana. 2. Plataforma backend: integracion con el software de caja (1C:Retail), procesamiento de bonificaciones en tiempo real, modulo analitico para marketing, API para integraciones con socios. 3. Migracion de datos: traslado de 1,2 millones de perfiles de clientes desde tarjetas plasticas, conservacion de bonificaciones acumuladas, vinculacion del historial de compras. Equipo del proyecto - Director de proyecto: Aleksei Sokolov (experiencia: 3 anos en proyectos de TI, anteriormente – sector bancario) - Desarrollo: equipo subcontratado "DigitalSoft" (8 personas: 2 iOS, 2 Android, 2 backend, 1 QA, 1 DevOps) - Diseno: freelancer (recomendacion de un conocido) - Marketing: responsable de marketing interno + agencia de promocion (presupuesto 4 millones) Resultados esperados (a 12 meses) - Instalaciones de la aplicacion: 0 -> 500 000 - Ticket medio: 870 rublos -> 1 050 rublos (+21%) - Frecuencia de compra: 3,2/sem. -> 3,8/sem. (+19%) - Porcentaje de compras con la aplicacion: 0% -> 35% - NPS: no medido -> 45+ Riesgos (segun la evaluacion del cliente) 1. Baja velocidad de carga en zonas rurales (30% de las tiendas estan en ciudades pequenas y pueblos). 2. Resistencia de los cajeros a la transicion al nuevo sistema. 3. Competencia con grandes cadenas por la atencion de los usuarios. Presupuesto - Desarrollo (subcontratacion): 9 000 000 rublos - Diseno y UX: 1 200 000 rublos - Infraestructura de servidores: 2 800 000 rublos - Marketing y promocion: 4 000 000 rublos - Gastos imprevistos: 1 000 000 rublos - Total: 18 000 000 rublos Supuestos clave - El equipo subcontratado estara asignado al proyecto full-time desde el 1 de mayo de 2025. - 1C:Retail soporta API para la integracion (no se ha verificado). - Los clientes con tarjeta plastica migraran a la aplicacion en un plazo de 6 meses. - La infraestructura de servidores soportara la carga de 500 000 usuarios. </project_brief> <task> Verifica los datos del tag <project_brief>: 1. Que cifras parecen sospechosamente optimistas? Por que? 2. Que calculos se pueden verificar aritmeticamente ahora mismo? 3. Que cifras faltan para tomar una decision? Formato: tabla | Afirmacion | Problema | Que verificar | </task>
Comparamos:
openai/gpt-5.4-nano · deepseek/deepseek-v3.2

Que sucedio

Los siete modelos produjeron el formato tabular. Pero lo mas interesante es otra cosa: el rol de “controlador financiero” obligo a los modelos a calcular.

Los siete encontraron el problema con la matematica del marketing – un presupuesto de marketing de 4 millones con un objetivo de 500 000 instalaciones da un CPI de 8 rublos, lo cual es irrealista para el mercado ruso. Todos encontraron inconsistencias aritmeticas en el presupuesto. Son los mismos modelos que en el prompt deficiente simplemente parafraseaban las cifras sin verificarlas.

La profundidad, en cambio, vario radicalmente: GPT-5.4 produjo una tabla de 36 filas, Gemma – de 7 filas. El formato es identico, el contenido – no.

Por que funciona

El tag <project_brief> le dice al modelo: estos son datos, no instrucciones. Sin tags, el modelo puede aceptar las afirmaciones del brief como hechos. Con tags, las procesa como datos de entrada que necesitan verificacion. Y el rol de controlador financiero establece el foco – verifica cifras, no evalues estrategia.

Si desea mas datos sobre XML-tags – en nuestras pruebas con modelos rusos, la plantilla XML vence en el 74–85% de los casos.

Tecnica 4: Red Teaming – el modelo ataca su propia respuesta

Red Teaming es un segundo prompt que se envia despues del primer analisis. El modelo cambia al rol de esceptico y ataca sus propias conclusiones.

Prompt (se envia DESPUES del analisis estructurado)

Ahora cambia de rol. Eres un inversor esceptico con 20 anos
de experiencia que busca razones para NO invertir en este proyecto.

Ataca tu analisis anterior:
1. Que riesgos pasaste por alto?
2. Donde fuiste demasiado suave en la evaluacion?
3. Que supuestos aceptaste sin verificar?
4. Que se derrumbara en los primeros 30 dias?

Se implacable. Nada de "sin embargo, el proyecto tiene potencial".

Que sucedio

Cada modelo encontro 2–3 riesgos adicionales que habia omitido en la primera pasada. Un hallazgo tipico – vendor lock-in: la dependencia de un unico subcontratista que tiene todo el codigo y la expertise. Este riesgo fue sistematicamente omitido por todos los modelos en el analisis inicial – y sistematicamente encontrado en el Red Teaming.

Pero lo mas revelador tiene que ver con la estadistica de mercado no verificada. En el brief dice “el mercado crecio un 24%” con referencia a NielsenIQ. Solo un modelo de siete (GPT-5.4) en uno de los cuatro prompts cuestiono esta cifra. Los demas la aceptaron como un hecho.

Por que funciona

La primera pasada crea inercia – el modelo elige un framing y lo sigue. El Red Teaming rompe esa inercia, asignando un rol opuesto. “Busca razones para NO invertir” no es simplemente otro angulo, es una tarea de optimizacion diferente.

Red Teaming y 8 tecnicas mas – en el modulo gratuito del curso. Practica con tareas reales de gestion, sin relleno ni teoria por la teoria.

Sin pago requerido • Notificación al lanzamiento

Unirse a la lista

Lo que la IA omite sistematicamente

28 ejecuciones sobre un brief con 16 problemas incorporadas dieron una imagen que no he encontrado en otros articulos sobre prompting. Normalmente se escribe “la IA encontro ideas interesantes” – pero nadie verifica que es exactamente lo que no encontro.

En resumen: el mejor modelo (GPT-5.4) detecto el 50% de los problemas incorporados, sumando los cuatro prompts. El peor (GPT-5.4 Nano) – el 22%. El promedio de los siete modelos – en algun punto intermedio. Ningun modelo encontro los 16.

Pero lo mas interesante no son los promedios, sino los puntos ciegos.

Problema #15 – “No hay QA por parte del cliente” – fue invisible para todos los modelos en todos los prompts. Cero de 28 ejecuciones. En el brief dice que el cliente tiene tres personas en el departamento de TI (administrador de sistemas, programador 1C, soporte tecnico) – pero ningun modelo concluyo que no habria nadie para recibir el trabajo del subcontratista. Para cualquier PM con experiencia en proyectos reales, esta es la primera pregunta: quien del lado del cliente recibira los releases? Quien hara el UAT? Para la IA – un problema invisible.

Problema #12 – “El crecimiento del mercado del 24% es una cifra no verificada” – se encontro una vez en 28 intentos. Un modelo, un prompt. En el brief dice “el mercado crecio un 24% (datos de NielsenIQ)” – y seis de siete modelos incluyeron esta cifra en su analisis como un hecho. No verificaron la fuente, no dudaron de su vigencia, no preguntaron por el periodo. La referencia a NielsenIQ funciono como un ‘sello de calidad’ – y los modelos no la cuestionan.

Lo llamare el ‘sesgo de autoridad’: si los datos se presentan con indicacion de fuente, el modelo los acepta como verdaderos. Es una consecuencia directa de como funciona el entrenamiento – los datos con fuentes en el corpus de entrenamiento suelen ser mas fiables. Pero en un brief de proyecto real, cualquiera puede escribir “segun datos de McKinsey”.

Tres niveles de hallazgos

Los datos del taller encajan bien en tres niveles:

Nivel 1 – problemas evidentes. Compatibilidad no verificada con 1C, freelancer de diseno sin respaldo, presupuesto insuficiente para imprevistos. Esto lo encuentran todos los modelos, incluso Nano. Basta con un prompt estructurado.

Nivel 2 – problemas calculables. CPI de 8 rublos, incompatibilidad de plazos del MVP con el volumen de funcionalidades, conversion irrealista de tarjetas plasticas a aplicacion. Esto lo encuentran la mayoria de los modelos, pero solo con el rol adecuado – “controlador financiero” o “PM risk-first”. Sin el rol, los modelos no activan la calculadora.

Nivel 3 – problemas contextuales. Ausencia de QA por parte del cliente, vendor lock-in con un unico proveedor, dudosa estadistica de mercado. Esto lo encuentran pocos, y no siempre. Aqui se necesita experiencia humana – conocimiento de lo que ocurre en proyectos reales, no en los documentos.

Tres niveles de problemas: que encuentra la IA y que omite

Esto es lo que significa: la IA es una excelente primera pasada. Detectara las inconsistencias presupuestarias obvias y los riesgos organizacionales. Pero no sustituye al experto que sabe donde mirar.

Hm.

Si utiliza la IA para analizar proyectos – y creo que deberia hacerlo – tenga en cuenta: lo que el modelo encontro no equivale a lo que existe. Los puntos ciegos no son aleatorios, son sistemicos. Los modelos encuentran bien lo que esta escrito explicitamente, y mal lo que necesita inferirse del contexto.

Conclusion practica

Cuatro tecnicas – cuatro herramientas para diferentes situaciones.

R-C-T-R-F (Rol, Contexto, Tarea, Restricciones, Formato) – higiene basica. Si solo va a recordar una cosa – recuerde el mnemonico. Funciona como una lista de verificacion: antes de enviar un prompt, repase las cinco letras y compruebe que todo esta en su sitio.

Few-Shot – cuando el formato es critico. Dos ejemplos son mas fiables que dos parrafos de explicaciones. Especialmente importante para modelos debiles y para tareas donde se necesita una plantilla concreta: registro de riesgos, evaluacion, informe.

XML-tags – cuando el prompt contiene muchos datos. Separan instrucciones de datos de entrada, evitan que el modelo confunda unas con otros.

Red Teaming – segunda pasada. No sustituye al primer analisis, lo complementa. Cuesta cero dinero adicional, rompe la inercia de la primera respuesta.

Las cuatro tecnicas funcionan con cualquier modelo – GPT, Claude, Gemini, DeepSeek. Las probamos en siete, incluyendo Qwen 3.6-27B y Gemma 4-26B. Los resultados difieren en profundidad, pero no en el patron: la estructura vence al caos independientemente del proveedor.

Y una cosa mas: toda la validacion costo $0.054. Cincuenta y cuatro milesimas de dolar por 28 ejecuciones en siete modelos. El prompting no se trata de herramientas caras. Se trata de como formula la tarea.

Todos los materiales del taller, incluyendo el brief del proyecto y los prompts para practicar por su cuenta (en ruso): hackmd.io/@belyaevstanislav/S1416ngRZg

Especialización

De los prompts al sistema

La base del curso analiza las cuatro tecnicas de este articulo con tareas reales de gestion: estructura, Few-Shot, XML-tags, Red Teaming. Mas seis tecnicas adicionales que no cupieron en el taller. Especializacion para managers – aplicacion en planificacion, analitica y trabajo en equipo.

От pre-mortem до антикризисного плана
Переиспользуемые промпт-шаблоны
Сквозной кейс на реальном проекте
~300 часов экономии в год
Stanislav Belyaev

Stanislav Belyaev

Engineering Leader en Microsoft

18 anos liderando equipos de ingenieria. Fundador de mysummit.school. 700+ graduados en Yandex Practicum y Stratoplan.