Фабрика гвоздей СССР: Уроки в управлении ИИ

На прошлой неделе я пролистывал профессиональный форум, когда наткнулся на признание, которое заставило меня громко рассмеяться, а затем сразу же прекратить смеяться.

Инженер Amazon написал:"Каждый раз, когда менеджер проекта говорит что-то глупое, я запускаю десять агентов ИИ, чтобы глубоко исследовать и проанализировать его. Я вставляю всю нашу историю в Slack в систему и позволяю ей разгуляться. Это отличное использование вычислительных ресурсов."

Al principio pensé que era solo toxicidad laboral disfrazada de broma. Pero los comentarios revelaron algo peor: no era una broma. Era venganza por KPI.

Amazon había desplegado recientemente un asistente de codificación de IA interno llamado MeshClaw. La dirección, en su sabiduría, estableció un objetivo estricto: el 80% de los desarrolladores deben usarlo semanalmente.Pero no se detuvieron ahí. Construyeron una tabla de clasificación en tiempo real que rastreaba el número exacto de tokens de IA que cada empleado consumía. Cuantos más tokens quemabas, mayor era tu rango.

El resultado fue instantáneo y completamente predecible. Los ingenieros comenzaron a alimentar documentos masivos y completamente irrelevantes en la IA: transcripciones de reuniones antiguas, páginas aleatorias de Wikipedia, sus listas de compras, solo para ver cómo se disparaba su consumo de tokens. Incluso le dieron un nombre: "Tokenmaxxing."

La mayoría de los ejecutivos leen esta historia y culpan a los empleados."¡Son perezosos! ¡Están manipulando el sistema!"

Están equivocados. Los empleados no son el problema. El diseño del sistema de gestiónes el problema. En el momento en que introduces una tabla de clasificación para un métrico de proceso, activas una de las trampas más antiguas en la organización humana. Y en la era de la IA, esa trampa está girando más rápido que nunca.

La Ley de Goodhart y los Clavos Inútiles

Hay un nombre formal para esta trampa, acuñado por un economista británico: La Ley de Goodhart.Establece:"Cuando una medida se convierte en un objetivo, deja de ser una buena medida."

Si quieres la versión visceral, mira a la fábrica de clavos soviética. Bajo la economía planificada, a un gerente de fábrica se le asignó una cuota basada en el pesode los clavos producidos. Así que la fábrica producía un pequeño número de clavos masivos y pesados—inútiles para los constructores, pero gloriosos en la balanza. La dirección se dio cuenta del error y cambió la cuota al númerode clavos. La fábrica inmediatamente se adaptó a producir millones de pequeños pines microscópicos. También inútiles. Pero bueno, el conteo estaba por las nubes.

Cuando gestionas por métricas arbitrarias, obtienes exactamente lo que pediste. Y destruyes por completo el producto real en el proceso.

El tablero de clasificación de tokens de Amazon es solo la fábrica de clavos soviética con una mejor interfaz de usuario.

La alucinación de 1.4 millones de dólares

Amazon no estaba solo. Meta tuvo, sin duda, la implementación más absurda.

Un tablero de clasificación interno y no oficial llamado "Claudeonomics"se rastreó el consumo de tokens entre 85,000 empleados. Los principales usuarios fueron coronados como "Leyendas del Token". El empleado #1 consumió 281 mil millones de tokens en 30 días—aproximadamente $1.4 millones en llamadas a la API.

La dirección inicialmente celebró esto como "adopción de IA." Luego, una auditoría más profunda reveló la verdad: los empleados estaban ejecutando tareas de IA sin sentido, impulsadas por bucles, únicamente para inflar sus números. Peor aún, varios cortes de producción en vivo se rastrearon directamente a ingenieros que se apresuraron a implementar código de baja calidad generado por IA solo para cumplir con sus cuotas. La tabla de clasificación fue desmantelada en silencio, pero el daño cultural ya estaba hecho.

Salesforce hizo algo similar: instaló un widget en las pantallas de los empleados que se actualizaba cada 15 minutos, mostrando su "Gasto en IA" y exigiendo que alcanzaran un "objetivo mínimo de consumo". Los desarrolladores que podrían haber hecho una búsqueda manual de dos minutos en su lugar forzaron a la IA a leer un manual técnico de 50 páginas, consumiendo miles de tokens, solo para satisfacer el panel de control.

El General No Debería Estar Contando Cabezas

Para entender por qué esto sigue sucediendo, necesitamos retroceder 2,000 años.

Durante la Dinastía Qin de China, un reformador llamado Shang Yang creó un sistema de recompensas militares llamado "Mérito por Decapitación." Los soldados de infantería eran recompensados con tierras y títulos estrictamente basados en el número de cabezas enemigas que decapitaban. Brutal, pero altamente efectivo para la infantería. Transformó al ejército Qin en una fuerza devastadora.

Pero Shang Yang era más inteligente que la mayoría de los CEOs modernos. Él declaró explícitamente que las métricas de decapitación solo se aplicaban a los soldados de primera línea. A los generales se les prohibía absolutamente ser evaluados por el conteo de cabezas.

¿Por qué? Porque el trabajo de un general no es matar individuos. Es orquestar el campo de batalla, gestionar la logística y ganar la guerra. Si evalúas a un general por cuántas cabezas corta personalmente, abandonará su puesto estratégico, tomará una espada y comenzará a pelear en el barro. Ganará su KPI personal. Y perderá la guerra.

Shang Yang entendió que la métrica debe coincidir con la responsabilidad. La medida es un medio para un fin, no el fin en sí mismo.

La gestión moderna ha olvidado esto. Hemos reemplazado el juicio estratégico por la adoración al panel de control. Seguimos lo que es fácil de contar—tokens, horas, indicaciones—en lugar de lo que es difícil de evaluar: juicio, calidad, impacto estratégico.

Por qué matamos el panel de control en Mercury

En Mercury, tomamos una decisión que suena radical pero que en realidad es simplemente sensata: prohibimos estrictamente el seguimiento de "Consumo de Tokens", "Indicaciones Generadas" o "Horas Ahorradas por IA" como métricas de rendimiento.

Recientemente leí un informe sobre una empresa farmacéutica que requería que cada empleado llenara un "Formulario de Resultados de IA" semanal, detallando exactamente cuántas horas les había ahorrado la IA.

El resultado fue desgarrador. Los ingenieros estaban trabajando con datos de I+D altamente clasificados que no podían ser subidos legalmente a LLMs externos. Así que hicieron el trabajo manualmente—ocho horas de codificación real. Luego pasaron treinta minutos adicionales generando una versión falsa y no funcional de la IA del código, solo para poder escribir "La IA me ahorró 3 horas"en su informe.

Un empleado entrevistado dijo algo que se me quedó grabado: "En realidad, no estaba en contra de usar IA antes de esto."

El sistema de gestión no solo fracasó en aumentar la productividad. Activamente destruyó la genuina curiosidad y buena voluntad del empleado hacia la tecnología.Convirtió una herramienta potencialmente útil en una tarea burocrática, y convirtió a ingenieros honestos en mentirosos.

Ce que nous regardons réellement

Alors, comment savez-vous si quelqu'un utilise efficacement l'IA ?

Vous ne pouvez pas regarder un tableau de bord. Vous devez examiner le travail réel.

Le chef de produit a-t-il expédié une analyse concurrentielle de meilleure qualité en trois jours au lieu de cinq ? Le code se déploie-t-il avec moins de bugs ? Concluons-nous des affaires plus rapidement ? Le client est-il plus satisfait ?

Ces résultats ne peuvent pas être suivis sur un tableau de classement de 15 minutes. Ils nécessitent que les managers s'engagent réellement avec le travail et évaluent les résultats qualitatifs. Ce qui est plus difficile que de lire un chiffre. C'est pourquoi la plupart des organisations ne le font pas.

Le vrai clou soviétique

Chaque époque a sa version du clou inutile. À l'ère industrielle, c'était des quotas de tonnage produisant de l'acier ingérable. À l'ère de la connaissance, c'était le journalisme basé sur le nombre de pages vues produisant des contenus accrocheurs sans valeur. À l'ère de l'IA, c'est une énorme pile inutile de jetons API brûlés uniquement pour satisfaire un dirigeant aveugle qui pense que la consommation équivaut à la productivité.

Les ingénieurs qui maximisent les jetons chez Amazon et Meta ne sont pas stupides. Ils sontactores racionales en un sistema irracional. Han aprendido que el camino de menor resistencia es darle al algoritmo lo que quiere—un gran número—mientras preservan silenciosamente su cordura real.

Si estás dirigiendo un equipo en este momento, y estás pensando en establecer un " adopción de IA objetivo," o rastrear "gasto mensual en tokens por empleado," o construir una tabla de clasificación para gamificar el uso—detente. No estás midiendo la productividad. Estás fabricando clavos que nadie puede usar.

Deja de gestionar los tokens. Comienza a gestionar el negocio.

— James, Mercury Technology Solutions, Hong Kong, mayo de 2026

Фабрика гвоздей СССР, теперь работающая на GPU

La Ley de Goodhart y los Clavos Inútiles

La alucinación de 1.4 millones de dólares

El General No Debería Estar Contando Cabezas

Por qué matamos el panel de control en Mercury

Ce que nous regardons réellement

Le vrai clou soviétique

Topik yang Ditandai

Lanjutkan Perjalanan Anda

Loteri Desain Chip: Mengapa Gelar 985 Anda Sekarang Hanya Trofi Partisipasi

The AI Reputation Team: Why Your Marketing Org Chart Is Already Obsolete

Bacaan Terkait

Apa yang Tidak Dapat Diberitahukan AI Tentang Karier Anda (Dan Mengapa Kebanyakan Orang Membaca Naskah yang Salah)

The AI Anxiety Trap: Why the Best AI Researchers Are Terrified—And What They're Doing About It

Lanjutkan Membaca

Lebih banyak oleh James Huang

Loteri Desain Chip: Mengapa Gelar 985 Anda Sekarang Hanya Trofi Partisipasi

The AI Reputation Team: Why Your Marketing Org Chart Is Already Obsolete