Una IA con criterio en una empresa no es la que mejor escribe. Es la que decide como decidiría un director de operaciones que conoce el negocio, los márgenes, los proveedores y los clientes. Esa IA es minoritaria. La mayoría de los pilotos que se firman este año producen borradores correctos en la forma y vacíos en el fondo. Se rechazan en revisión, se abandonan a las tres semanas y la empresa concluye que la IA no funciona. Funciona. Lo que falla es el criterio que se le ha transferido. Este artículo desarma cómo se construye una IA con criterio operativo real y por qué la mayoría instala IA sin criterio sin saberlo.
La IA sin criterio amplifica el ruido operativo de la empresa#
Una distribuidora industrial de 45 personas con cuatro líneas de producto y siete comerciales decidió, en febrero de 2026, instalar agentes de IA en tres áreas: redacción de presupuestos, primera respuesta a leads y gestión de incidencias logísticas. Los proveedores eran solventes, los modelos los de última generación, los flujos correctamente cableados. Tres meses después, el director de operaciones tenía una bandeja con 380 borradores generados por los agentes y 312 marcados como descartados. La operativa no había mejorado: había añadido una capa de revisión que antes no existía.
El diagnóstico que el equipo dio al principio fue técnico: faltan datos, hace falta más fine-tuning, hay que cambiar el modelo. El diagnóstico de fondo era operativo: los agentes producían según media de internet, no según criterio de la empresa. Cuando un comercial recibía un borrador, lo descartaba porque proponía descuento estándar a un cliente que en esa empresa tiene política de cero descuento. Cuando logística recibía una respuesta de incidencia, la rehacía porque ofrecía un plazo de reposición que la distribuidora nunca había firmado.
Ese es el patrón. La IA sin criterio empresarial no falla por escritura. Falla por contexto. Y al fallar por contexto, llena la empresa de outputs que el equipo tiene que filtrar uno a uno. Cerca del 47% de empleados de empresas que han instalado IA admite haber tomado al menos una decisión importante basada en contenido alucinado por el modelo. El coste medio de verificación manual ronda las 4,3 horas semanales por empleado: para una empresa de 500 personas son aproximadamente 7,1 millones de euros al año en horas dedicadas a corregir lo que la IA debería haber producido bien. La conclusión operativa es directa. Una IA sin criterio no ahorra trabajo. Lo desplaza.
Es la diferencia entre conectar herramientas y desplegar infraestructura de IA con criterio operativo.
Por qué un agente que escribe perfecto produce piezas que rechazas en revisión#
Hay un sesgo común en la evaluación inicial de un piloto de IA: medir la calidad por la fluidez del texto. La IA escribe bien, los párrafos están limpios, la ortografía es correcta. Eso no demuestra criterio. Demuestra estilo. Una redacción correcta sobre la base equivocada produce daño con buena gramática.
El criterio operativo de una empresa de 7 u 8 cifras no está documentado en un manual público. Está repartido en cabezas: el director comercial sabe qué clientes no aceptan precio, el responsable de almacén sabe qué SKU no se promete antes de quince días, dirección sabe qué sectores la empresa rechaza por margen. Cuando un agente de IA llega sin acceso a ese criterio, opera por patrón general. Por patrón general, da descuento. Por patrón general, ofrece envío en 48 horas. Por patrón general, propone correos de bienvenida con tono cercano. Lo correcto en general suele ser lo incorrecto en particular. Si quieres entender cómo se diseña la capa que coordina ese criterio dentro de una empresa, está cubierto en el artículo sobre el CEO de IA como capa de decisión.
Lo que rompe la fluidez como métrica es que en B2B con ticket alto la decisión correcta tiene contexto: cliente, histórico, margen, gestión interna previa, aviso de logística. El agente sin criterio no ve nada de eso. Por eso un porcentaje significativo de los pilotos no llega a producción. El informe RAND 2024 sobre por qué fallan los proyectos de IA midió que más del 80% de los proyectos de IA empresarial no superan la fase de prueba y se quedan en piloto, exactamente el doble de la tasa de fallo de proyectos de TI sin componente de IA. McKinsey, en su State of AI, reportó que solo aproximadamente el 6% de las organizaciones declara obtener un valor significativo de su inversión en IA pese a que el 78% la utiliza en al menos una función.
El gap entre adopción y valor no es un gap técnico. Es un gap de criterio. La empresa que adopta IA sin codificar su criterio operativo replica la media. La media no es lo que la empresa hace cuando está bien dirigida.
Qué significa exactamente que una IA opera con criterio empresarial#
Una IA con criterio empresarial es la que produce el output que produciría un director del área si tuviera tiempo y todo el contexto presente. No es un modelo más avanzado. No es un prompt más largo. Es un sistema que tiene acceso estructurado al criterio que la empresa ha codificado, y que falla cuando no lo tiene. La diferencia entre IA con criterio e IA sin criterio se ve en cuatro dimensiones operativas concretas.

Decisión, no producción. El agente con criterio no genera contenido como objetivo final: genera decisiones operativas (aprobar, rechazar, escalar, derivar) y produce contenido como consecuencia de esa decisión. El agente sin criterio invierte el orden: produce primero y deja que el humano decida después.
Memoria contextual del cliente. El agente con criterio sabe que el cliente X compró tres veces este año, que tuvo una incidencia hace seis semanas y que el comercial Y lleva la cuenta. El agente sin criterio empieza cada interacción como si fuera la primera.
Tono y guardrails de la empresa. El agente con criterio respeta el registro y los temas que la empresa no toca: no promete plazos no firmados, no propone precios no autorizados, no responde temas fuera de scope. El agente sin criterio responde a todo lo que se le pregunta porque su entrenamiento base le dice que ser útil equivale a producir respuesta.
Reporting de excepciones, no de actividad. El agente con criterio reporta lo que el humano necesita decidir: la incidencia que ha escalado, el lead que ha calificado fuera de patrón, el caso que ha derivado al comercial. El agente sin criterio reporta volumen: cuántas piezas ha producido, cuántos correos ha enviado, cuántas líneas ha escrito.
Cuando una empresa instala estas cuatro dimensiones en su capa de IA, el efecto operativo cambia: el equipo deja de revisar todo y empieza a revisar solo las excepciones. Esa es la métrica que importa de una IA con criterio. La cantidad de outputs que el equipo confirma sin tocar.
Los cinco vectores que transfieren criterio operativo al sistema#
Codificar el criterio de una empresa en un sistema de IA no es subir documentos a un asistente. Es identificar dónde vive el criterio en la organización, extraerlo en un formato accesible al sistema y mantenerlo actualizado cuando el criterio cambia. Estos son los cinco vectores donde se concentra ese trabajo.

1. Reglas de cliente y segmentación. No todos los clientes valen lo mismo. Hay clientes con cero descuento autorizado, hay clientes que requieren validación del comercial antes de cualquier respuesta, hay sectores que la empresa rechaza por margen o por exposición legal. Este criterio vive en la dirección comercial, a veces en una hoja de Excel manual. Hasta que no está codificado en el sistema, el agente opera por patrón medio del mercado.
2. Catálogo y disponibilidad operativa. El catálogo público no es el catálogo operativo. Hay SKU descatalogados que siguen indexados, hay productos con plazo de entrega efectivo distinto al publicado, hay variantes que se promocionan o se evitan según trimestre. Sin ese vector, el agente promete cosas que la empresa no puede entregar.
3. Tono y registros por canal. El correo a un cliente industrial no se escribe igual que el correo a un cliente DTC. La respuesta en LinkedIn no es la respuesta en email. La forma de la empresa no es opcional: es el filtro que la dirección de marketing ya aplica manualmente. Codificarlo es el siguiente paso.
4. Política de excepciones. Qué se escala, a quién, en cuánto tiempo. Qué casos no se contestan automáticamente. Qué temas requieren validación humana antes de salir. Sin esa política, el agente o se vuelve mudo, rechaza todo por seguridad, o se vuelve temerario, responde todo sin filtro.
5. Lazo de medición. El criterio no es estático. Las reglas cambian, el catálogo cambia, los clientes cambian. Si el sistema no mide qué outputs se aceptan y cuáles se rechazan, el criterio se desfasa al tercer trimestre. La medición es el último vector porque sin él los cuatro anteriores degradan en silencio.
Este trabajo no es técnico en su parte difícil. Es un trabajo de extracción de criterio. Por eso falla cuando se delega solo al equipo técnico. Una pieza más amplia sobre cómo se ordena este trabajo en la práctica está en el artículo de las capas que sostienen la infraestructura de IA empresarial.
Cómo reconocer en métricas que tu empresa paga IA sin criterio#
Hay una forma rápida de auditar si la IA que ya tienes instalada opera con criterio o sin él. Tres síntomas operativos, medibles en una semana de trabajo del equipo.
Síntoma 1: ratio de outputs descartados sobre outputs producidos. Si tu equipo descarta o reescribe más del 30% de lo que el agente entrega, no es problema del modelo. Es problema de criterio. La distribuidora industrial del primer ejemplo tenía un 82% de descarte. En el patrón que hemos observado en empresas 7-8 cifras, la empresa con IA con criterio empresa instalada correctamente queda por debajo del 10%.
Síntoma 2: tiempo medio de revisión por output. Si revisar un borrador del agente tarda lo mismo que escribirlo desde cero, el agente no aporta margen. Aporta ilusión de velocidad. Según los casos que hemos instalado, la revisión efectiva queda por debajo de un tercio del tiempo de redacción manual.
Síntoma 3: número de excepciones que el agente escala vs número de excepciones que el equipo descubre tarde. Un agente con criterio escala en el momento. Un agente sin criterio entrega cualquier respuesta y deja que el equipo descubra el error en revisión, en una incidencia o, peor, en una queja del cliente. Si tu agente nunca escala, no significa que decida bien. Significa que no decide.
S&P Global Market Intelligence midió en 2025 que cerca del 42% de las empresas que iniciaron proyectos de IA en el último año los abandonaron antes de llegar a producción, y que aproximadamente el 46% de las pruebas de concepto se descartan antes de despliegue. La causa más citada en esos abandonos no es el coste del modelo ni la latencia técnica. Es la imposibilidad de transferir criterio operativo al sistema con los métodos que el proveedor estándar ofrece.
Si los tres síntomas aparecen juntos, la empresa no necesita cambiar de modelo de IA. Necesita reinstalar la capa de criterio antes de tocar el modelo. Es la pregunta de fondo de la elección entre agencia de automatización y arquitecto de IA: quién diseña la capa de criterio, no quién conecta los flujos.
Quién codifica el criterio: la capa que falta entre dirección y agente#
El criterio operativo no se codifica solo. Tampoco se codifica desde el equipo técnico, que conoce el modelo pero no la operación. Tampoco se codifica desde el equipo comercial, que conoce la operación pero no el sistema. Codificar criterio requiere una capa intermedia que ya existe en empresas medianas establecidas pero rara vez está formalizada para IA: la dirección de operaciones.
La dirección de operaciones es quien tiene visibilidad sobre los cinco vectores del apartado anterior. Sabe qué cliente exige cero descuento porque ha visto el histórico. Sabe qué SKU no se promete antes de plazo porque coordina con almacén. Sabe qué tono se usa porque revisa al equipo. Y sabe qué se escala porque es quien recibe la escalada hoy. Lo que la mayoría de las empresas hacen es saltarse esa capa y dar acceso directo del agente al modelo, esperando que el equipo técnico capture criterio que no conoce. Esa es la fractura. La fractura aparece exactamente cuando la empresa cruza el muro operativo y suma herramientas en lugar de codificar reglas.
Una distribuidora industrial que instala IA con criterio empieza por una sesión estructurada con la dirección de operaciones para extraer las reglas implícitas. No con un brief de marketing. No con un prompt elaborado por el proveedor. Con preguntas concretas sobre clientes, SKU y casos cerrados de la propia empresa. Esa extracción es lo que la mayoría de las agencias de automatización no hacen porque no es su trabajo y porque su modelo de pricing no lo paga.
Esa capa hoy se rompe en más del 80% de las empresas medianas que han adoptado IA. Resolverla no es contratar una agencia externa que conecta APIs, ni añadir otro GPT al stack, ni fichar un freelance que escribe prompts. Es instalar la arquitectura que decide con el criterio del fundador y reporta solo excepciones, no actividad. Una agencia conecta herramientas. Un arquitecto codifica criterio.
El insight final no es que falte tecnología. Es cultural. El criterio que una empresa de cierta dimensión tiene en la cabeza de la dirección de operaciones es el activo que la diferencia. Un agente que no opera con ese criterio reproduce la media del mercado. La empresa que ha llegado hasta aquí no se diferencia por la media. Se diferencia por las decisiones específicas que toma cuando un caso particular llega a la mesa. Hasta que ese criterio no está codificado en la capa de IA, el sistema ofrece velocidad sin diferenciación. Eso no es lo que la empresa necesita.
Si el criterio operativo de tu empresa está en cabezas y no en la capa de IA, el siguiente paso no es contratar más personas que filtren outputs ni cambiar de modelo. Es codificar la arquitectura que decide con ese criterio, instalada dentro de la empresa y operando con el criterio del fundador. ## Lo que entregamos cuando codificamos el criterio operativo de la empresa
El criterio no se codifica con el equipo técnico ni con un brief de marca. Se codifica con la dirección de operaciones del cliente, en sesiones de codificación donde extraemos las reglas que están en la cabeza del fundador y las directoras de área, las traducimos a directivas operables y las cargamos en cada agente como bloque persistente.
Lo que queda instalado son tres documentos vivos: el carácter de marca y los sesgos editoriales codificados, los SOPs operativos críticos en formato ejecutable por agente, y las skills reutilizables por departamento. Cuando una decisión cambia, se actualiza el documento y el agente correspondiente la aplica desde la siguiente ejecución. Lo que no se delega es la decisión sobre qué decisión cambiar.
