Fábrica de Clavos Soviética: Lecciones en Gestión de IA

Estaba desplazándome por un foro profesional la semana pasada cuando encontré una confesión que me hizo reír a carcajadas, y luego detenerme de inmediato.

Un ingeniero de Amazon escribió: "Cada vez que un gerente de proyecto dice algo estúpido, lanzo diez agentes de IA para investigar y analizarlo a fondo. Copio todo nuestro historial de Slack en el sistema y lo dejo funcionar libremente. Es un excelente uso de los recursos de computación."

Al principio pensé que era solo toxicidad laboral disfrazada de broma. Pero los comentarios revelaron algo peor: no era una broma. Era venganza por KPI.

Amazon había desplegado recientemente un asistente de codificación de IA interno llamado MeshClaw. La dirección, en su sabiduría, estableció un objetivo estricto: el 80% de los desarrolladores debe usarlo semanalmente.Pero no se detuvieron ahí. Construyeron una tabla de clasificación en tiempo real que rastreaba el número exacto de tokens de IA que cada empleado consumía. Cuantos más tokens quemabas, más alto era tu rango.

El resultado fue instantáneo y completamente predecible. Los ingenieros comenzaron a alimentar documentos masivos y completamente irrelevantes a la IA: viejas transcripciones de reuniones, páginas aleatorias de Wikipedia, sus listas de compras, solo para ver cómo se disparaba su consumo de tokens. Incluso le dieron un nombre: "Tokenmaxxing."

La mayoría de los ejecutivos leen esta historia y culpan a los empleados."¡Son perezosos! ¡Están manipulando el sistema!"

Están equivocados. Los empleados no son el problema. El diseño del sistema de gestiónes el problema. En el momento en que introduces una tabla de clasificación para un indicador de proceso, activas una de las trampas más antiguas en la organización humana. Y en la era de la IA, esa trampa está girando más rápido que nunca.

La Ley de Goodhart y los Clavos Inútiles

Hay un nombre formal para esta trampa, acuñado por un economista británico: La Ley de Goodhart.Establece:"Cuando una medida se convierte en un objetivo, deja de ser una buena medida."

Si quieres la versión visceral, mira la fábrica de clavos soviética. Bajo la economía planificada, a un gerente de fábrica se le asignó una cuota basada en el pesode los clavos producidos. Así que la fábrica producía un pequeño número de clavos masivos y pesados—inútiles para los constructores, pero gloriosos en la balanza. La dirección se dio cuenta del error y cambió la cuota al númerode clavos. La fábrica inmediatamente se adaptó a producir millones de pequeños pines microscópicos. También inútiles. Pero bueno, el conteo estaba por las nubes.

Cuando gestionas por métricas arbitrarias, obtienes exactamente lo que pediste. Y destruyes completamente el producto real en el proceso.

El tablero de tokens de Amazon es solo la fábrica de clavos soviética con una mejor interfaz de usuario.

La alucinación de 1.4 millones de dólares

Amazon no estaba solo. Meta tuvo, sin duda, la implementación más absurda.

Un tablero interno y no oficial llamado "Claudeonomics"se rastreó el consumo de tokens entre 85,000 empleados. Los principales usuarios fueron coronados como "Leyendas del Token". El empleado #1 consumió 281 mil millones de tokens en 30 días—aproximadamente $1.4 millones en llamadas a la API.

La dirección inicialmente celebró esto como "adopción de IA". Luego, una auditoría más profunda reveló la verdad: los empleados estaban ejecutando tareas de IA sin sentido, impulsadas por bucles, solo para inflar sus números. Peor aún, varios cortes de producción en vivo se rastrearon directamente a ingenieros que se apresuraron a implementar código de baja calidad generado por IA solo para cumplir con sus cuotas. La tabla de clasificación fue desmantelada en silencio, pero el daño cultural ya estaba hecho.

Salesforce hizo algo similar: instaló un widget en las pantallas de los empleados que se actualizaba cada 15 minutos, mostrando su "Gasto en IA" y exigiendo que alcanzaran un "objetivo mínimo de consumo". Los desarrolladores que podrían haber hecho una búsqueda manual de dos minutos en su lugar forzaron a la IA a leer un manual técnico de 50 páginas, consumiendo miles de tokens, solo para satisfacer el tablero.

El General No Debería Estar Contando Cabezas

Para entender por qué esto sigue sucediendo, necesitamos retroceder 2,000 años.

Durante la Dinastía Qin de China, un reformador llamado Shang Yang creó un sistema de recompensas militares llamado "Mérito por Decapitación."Los soldados de infantería eran recompensados con tierras y títulos estrictamente basados en el número de cabezas enemigas que decapitaban. Brutal, pero altamente efectivo para la infantería. Convirtió al ejército Qin en una fuerza devastadora.

Pero Shang Yang era más inteligente que la mayoría de los CEO modernos. Él declaró explícitamente que las métricas de decapitación solo se aplicaban a los soldados de primera línea.A los generales se les prohibía absolutamente ser evaluados por el conteo de cabezas.

¿Por qué? Porque el trabajo de un general no es matar individuos. Es orquestar el campo de batalla, gestionar la logística y ganar la guerra. Si evalúas a un general por cuántas cabezas corta personalmente, abandonará su puesto estratégico, tomará una espada y comenzará a pelear en el barro. Ganará su KPI personal. Y perderá la guerra.

Shang Yang entendió que la métrica debe coincidir con la responsabilidad. La medida es un medio para un fin, no el fin en sí mismo.

La gestión moderna ha olvidado esto. Hemos reemplazado el juicio estratégico por la adoración al tablero de control. Seguimos lo que es fácil de contar—tokens, horas, indicaciones—en lugar de lo que es difícil de evaluar: juicio, calidad, impacto estratégico.

Por qué matamos el tablero de control en Mercury

En Mercury, tomamos una decisión que suena radical pero que en realidad es simplemente sensata: prohibimos estrictamente rastrear "Consumo de Tokens", "Indicaciones Generadas" o "Horas Ahorradas por IA" como métricas de rendimiento.

Recientemente leí un informe sobre una empresa farmacéutica que requería que cada empleado llenara un "Formulario de Resultados de IA" semanal, detallando exactamente cuántas horas les había ahorrado la IA.

El resultado fue desgarrador. Los ingenieros estaban trabajando con datos de I+D altamente clasificados que no podían ser subidos legalmente a LLMs externos. Así que hicieron el trabajo manualmente—ocho horas de codificación real. Luego pasaron treinta minutos adicionales generando una versión falsa y no funcional de la IA del código, solo para poder escribir "La IA me ahorró 3 horas"en su informe.

Un empleado entrevistado dijo algo que se me quedó grabado: "En realidad, no me oponía a usar IA antes de esto."

El sistema de gestión no solo fracasó en aumentar la productividad. Activamente destruyó la curiosidad genuina y la buena voluntad del empleado hacia la tecnología.Convirtió una herramienta potencialmente útil en una tarea burocrática, y convirtió a ingenieros honestos en mentirosos.

Ce que nous regardons réellement

Alors, comment savez-vous si quelqu'un utilise efficacement l'IA ?

Vous ne pouvez pas regarder un tableau de bord. Vous devez regarder le travail réel.

Le chef de produit a-t-il expédié une analyse concurrentielle de meilleure qualité en trois jours au lieu de cinq ? Le code se déploie-t-il avec moins de bogues ? Concluons-nous des affaires plus rapidement ? Le client est-il plus satisfait ?

Ces résultats ne peuvent pas être suivis sur un tableau de classement de 15 minutes. Ils nécessitent que les managers s'engagent réellement avec le travail et évaluent les résultats qualitatifs. Ce qui est plus difficile que de lire un chiffre. C'est pourquoi la plupart des organisations ne le font pas.

Le véritable clou soviétique

Chaque époque a sa version du clou inutile. À l'ère industrielle, c'était des quotas de tonnage produisant de l'acier ingérable. À l'ère de la connaissance, c'était le journalisme basé sur le nombre de pages vues produisant des contenus accrocheurs sans valeur. À l'ère de l'IA, c'est une énorme pile inutile de jetons API brûlés uniquement pour satisfaire un dirigeant aveugle qui pense que la consommation équivaut à la productivité.

Les ingénieurs qui maximisent les jetons chez Amazon et Meta ne sont pas stupides. Ils sontactores racionales en un sistema irracional. Han aprendido que el camino de menor resistencia es darle al algoritmo lo que quiere—un gran número—mientras preservan silenciosamente su cordura real.

Si estás dirigiendo un equipo en este momento, y estás pensando en establecer un " adopción de IA objetivo," o rastrear "gasto mensual de tokens por empleado," o construir una tabla de clasificación para gamificar el uso—detente. No estás midiendo la productividad. Estás fabricando clavos que nadie puede usar.

Deja de gestionar los tokens. Comienza a gestionar el negocio.

— James, Mercury Technology Solutions, Hong Kong, mayo de 2026

La Fábrica de Clavos Soviética, Ahora Funcionando con GPUs

La Ley de Goodhart y los Clavos Inútiles

La alucinación de 1.4 millones de dólares

El General No Debería Estar Contando Cabezas

Por qué matamos el tablero de control en Mercury

Ce que nous regardons réellement

Le véritable clou soviétique

หัวข้อที่แท็ก

ดำเนินเส้นทางของคุณต่อ

ลอตเตอรี่การออกแบบชิป: ทำไมปริญญา 985 ของคุณจึงกลายเป็นถ้วยรางวัลการเข้าร่วม

The AI Reputation Team: Why Your Marketing Org Chart Is Already Obsolete

การอ่านที่เกี่ยวข้อง

สิ่งที่ AI ไม่สามารถบอกคุณเกี่ยวกับอาชีพของคุณ (และทำไมคนส่วนใหญ่ถึงอ่านสคริปต์ที่ผิด)

The AI Anxiety Trap: Why the Best AI Researchers Are Terrified—And What They're Doing About It

อ่านต่อ

เพิ่มเติมโดย James Huang

ลอตเตอรี่การออกแบบชิป: ทำไมปริญญา 985 ของคุณจึงกลายเป็นถ้วยรางวัลการเข้าร่วม

The AI Reputation Team: Why Your Marketing Org Chart Is Already Obsolete