Estaba desplazándome por un foro profesional la semana pasada cuando encontré una confesión que me hizo reír a carcajadas, y luego detenerme de inmediato.
Un ingeniero de Amazon escribió: "Cada vez que un gerente de proyecto dice algo estúpido, lanzo diez agentes de IA para investigar y analizarlo a fondo. Copio todo nuestro historial de Slack en el sistema y lo dejo funcionar libremente. Es un excelente uso de los recursos de computación."
Al principio pensé que era solo toxicidad laboral disfrazada de broma. Pero los comentarios revelaron algo peor: no era una broma. Era venganza por KPI.
Amazon había desplegado recientemente un asistente de codificación de IA interno llamado MeshClaw. La dirección, en su sabiduría, estableció un objetivo estricto: el 80% de los desarrolladores debe usarlo semanalmente.Pero no se detuvieron ahí. Construyeron una tabla de clasificación en tiempo real que rastreaba el número exacto de tokens de IA que cada empleado consumía. Cuantos más tokens quemabas, mayor era tu rango.
El resultado fue instantáneo y completamente predecible. Los ingenieros comenzaron a alimentar documentos masivos y completamente irrelevantes a la IA: viejas transcripciones de reuniones, páginas aleatorias de Wikipedia, sus listas de compras, solo para ver cómo se disparaba su consumo de tokens. Incluso le dieron un nombre: "Tokenmaxxing."
La mayoría de los ejecutivos leen esta historia y culpan a los empleados."¡Son perezosos! ¡Están manipulando el sistema!"
Están equivocados. Los empleados no son el problema. La arquitectura del sistema de gestión es el problema. En el momento en que introduces un ranking para una métrica de proceso, activas una de las trampas más antiguas en la organización humana. Y en la era de la IA, esa trampa está girando más rápido que nunca.
La Ley de Goodhart y los Clavos Inútiles
Hay un nombre formal para esta trampa, acuñado por un economista británico: La Ley de Goodhart.Establece:"Cuando una medida se convierte en un objetivo, deja de ser una buena medida."
Si quieres la versión visceral, mira la fábrica de clavos soviética. Bajo la economía planificada, a un gerente de fábrica se le asignó una cuota basada en el pesode los clavos producidos. Así que la fábrica producía un pequeño número de clavos masivos y pesados—inútiles para los constructores, pero gloriosos en la balanza. La dirección se dio cuenta del error y cambió la cuota al númerode clavos. La fábrica inmediatamente se adaptó a producir millones de pequeños pines microscópicos. También inútiles. Pero bueno, el conteo estaba por las nubes.
Cuando gestionas por métricas arbitrarias, obtienes exactamente lo que pediste. Y destruyes completamente el producto real en el proceso.
La tabla de clasificación de tokens de Amazon es solo la fábrica de clavos soviética con una mejor interfaz de usuario.
La alucinación de 1.4 millones de dólares
Amazon no estaba solo. Meta tuvo, sin duda, la implementación más absurda.
Una tabla de clasificación interna y no oficial llamada "Claudeonomics"se rastreó el consumo de tokens entre 85,000 empleados. Los principales usuarios fueron coronados como "Leyendas del Token." El empleado #1 consumió 281 mil millones de tokens en 30 días—aproximadamente $1.4 millones en llamadas a la API.
La dirección inicialmente celebró esto como "adopción de IA." Luego, una auditoría más profunda reveló la verdad: los empleados estaban ejecutando tareas de IA sin sentido, impulsadas por bucles, únicamente para inflar sus números. Peor aún, varias interrupciones en la producción en vivo se rastrearon directamente a ingenieros que se apresuraron a implementar código de baja calidad generado por IA solo para cumplir con sus cuotas. La tabla de clasificación fue desmantelada en silencio, pero el daño cultural ya estaba hecho.
Salesforce hizo algo similar: instaló un widget en las pantallas de los empleados que se actualizaba cada 15 minutos, mostrando su "Gasto en IA" y exigiendo que alcanzaran un "objetivo mínimo de consumo." Los desarrolladores que podrían haber hecho una búsqueda manual de dos minutos, en su lugar, forzaron a la IA a leer un manual técnico de 50 páginas, consumiendo miles de tokens, solo para satisfacer el panel de control.
El General No Debería Estar Contando Cabezas
Para entender por qué esto sigue sucediendo, necesitamos retroceder 2,000 años.
Durante la Dinastía Qin de China, un reformador llamado Shang Yang creó un sistema de recompensas militares llamado "Mérito por Decapitación." Los soldados de infantería eran recompensados con tierras y títulos estrictamente basados en el número de cabezas enemigas que decapitaban. Brutal, pero altamente efectivo para la infantería. Transformó al ejército Qin en una fuerza devastadora.
Pero Shang Yang era más inteligente que la mayoría de los CEOs modernos. Él declaró explícitamente que las métricas de decapitación solo se aplicaban a los soldados de primera línea. A los generales se les prohibía absolutamente ser evaluados por el conteo de cabezas.
¿Por qué? Porque el trabajo de un general no es matar individuos. Es orquestar el campo de batalla, gestionar la logística y ganar la guerra. Si evalúas a un general por cuántas cabezas corta personalmente, abandonará su puesto estratégico, tomará una espada y comenzará a pelear en el barro. Ganará su KPI personal. Y perderá la guerra.
Shang Yang entendió que la métrica debe coincidir con la responsabilidad. La medida es un medio para un fin, no el fin en sí mismo.
La gestión moderna ha olvidado esto. Hemos reemplazado el juicio estratégico por la adoración al tablero de control. Seguimos lo que es fácil de contar—tokens, horas, indicaciones—en lugar de lo que es difícil de evaluar: juicio, calidad, impacto estratégico.
Por qué matamos el tablero de control en Mercury
En Mercury, tomamos una decisión que suena radical pero que en realidad es simplemente sensata: prohibimos estrictamente rastrear "Consumo de Tokens", "Indicaciones Generadas" o "Horas Ahorradas por IA" como métricas de rendimiento.
Recientemente leí un informe sobre una empresa farmacéutica que requería que cada empleado llenara un "Formulario de Resultados de IA" semanal, detallando exactamente cuántas horas les había ahorrado la IA.
El resultado fue desgarrador. Los ingenieros estaban trabajando con datos de I+D altamente clasificados que no podían ser subidos legalmente a LLMs externos. Así que hicieron el trabajo manualmente—ocho horas de codificación real. Luego pasaron treinta minutos adicionales generando una versión falsa de IA no funcional del código, solo para poder escribir "La IA me ahorró 3 horas"en su informe.
Un empleado entrevistado dijo algo que se me quedó grabado: "En realidad, no estaba en contra de usar IA antes de esto."
El sistema de gestión no solo fracasó en aumentar la productividad. Activamente destruyó la genuina curiosidad y buena voluntad del empleado hacia la tecnología.Convirtió una herramienta potencialmente útil en una tarea burocrática, y convirtió a ingenieros honestos en mentirosos.
Lo Que Realmente Miramos
Entonces, ¿cómo sabes si alguien está utilizando la IA de manera efectiva?
No puedes mirar un panel de control. Tienes que observar el trabajo real.
¿El gerente de producto entregó un análisis competitivo de mayor calidad en tres días en lugar de cinco? ¿El código se está implementando con menos errores? ¿Estamos cerrando tratos más rápido? ¿Está el cliente más satisfecho?
Estos resultados no se pueden rastrear en un tablero de líderes de tokens de 15 minutos. Requieren que los gerentes se involucren realmente con el trabajo y evalúen resultados cualitativos. Lo cual es más difícil que leer un número. Por eso la mayoría de las organizaciones no lo hacen.
El Verdadero Clavo Soviético
Cada era tiene su versión del clavo inútil. En la era industrial, eran las cuotas de tonelaje que producían acero ingobernable. En la era del conocimiento, era el periodismo de vistas de página que producía basura sensacionalista. En la era de la IA, es un montón masivo e inútil de tokens de API quemados puramente para satisfacer a un ejecutivo ciego que piensa que el consumo equivale a productividad.
Los ingenieros maximizando tokens en Amazon y Meta no son estúpidos. Ellos sonactores racionales en un sistema irracional. Han aprendido que el camino de menor resistencia es darle al algoritmo lo que quiere—un gran número—mientras preservan silenciosamente su cordura real.
Si estás dirigiendo un equipo en este momento, y estás pensando en establecer un " adopción de IA objetivo," o rastrear "gasto mensual de tokens por empleado," o construir una tabla de clasificación para gamificar el uso—detente. No estás midiendo la productividad. Estás fabricando clavos que nadie puede usar.
Deja de gestionar los tokens. Comienza a gestionar el negocio.
— James, Mercury Technology Solutions, Hong Kong, mayo de 2026


