Usine de clous soviétique : leçons en gestion de l'IA

Je faisais défiler un forum professionnel la semaine dernière quand j'ai trouvé une confession qui m'a fait rire aux éclats, puis j'ai immédiatement arrêté de rire.

Un ingénieur d'Amazon a écrit : "Chaque fois qu'un chef de projet dit quelque chose de stupide, je lance dix agents IA pour le rechercher et l'analyser en profondeur. Je colle tout notre historique Slack dans le système et le laisse s'emballer. C'est une excellente utilisation des ressources de calcul."

Au début, je pensais que c'était juste de la toxicité au travail déguisée en blague. Mais les commentaires ont révélé quelque chose de pire : ce n'était pas une blague. C'était une vengeance par KPI.

Amazon avait récemment déployé un assistant de codage IA interne appelé MeshClaw. La direction, dans sa sagesse, a fixé un objectif strict : 80 % des développeurs doivent l'utiliser chaque semaine. Mais ils ne se sont pas arrêtés là. Ils ont créé un tableau de classement en temps réel suivant le nombre exact de jetons IA consommés par chaque employé. Plus vous brûliez de jetons, plus votre rang était élevé.

Le résultat a été instantané et complètement prévisible. Les ingénieurs ont commencé à alimenter l'IA avec d'énormes documents complètement hors sujet—anciens transcriptions de réunions, pages Wikipédia aléatoires, leurs listes de courses—juste pour voir leur consommation de jetons exploser. Ils lui ont même donné un nom : "Tokenmaxxing."

La plupart des dirigeants lisent cette histoire et blâment les employés."Ils sont paresseux ! Ils exploitent le système !"

Ils ont tort. Les employés ne sont pas le problème. Le système de gestionest le problème. Au moment où vous introduisez un tableau de classement pour un indicateur de processus, vous déclenchez l'un des pièges les plus anciens de l'organisation humaine. Et à l'ère de l'IA, ce piège tourne plus vite que jamais.

La loi de Goodhart et les clous inutiles

Il existe un nom formel pour ce piège, inventé par un économiste britannique : La loi de Goodhart.Elle stipule :"Quand une mesure devient un objectif, elle cesse d'être une bonne mesure."

Si vous voulez la version viscérale, regardez l'usine de clous soviétique. Sous l'économie planifiée, un directeur d'usine recevait un quota basé sur le poidsdes clous produits. Ainsi, l'usine produisait un petit nombre de clous massifs et lourds—inutiles pour les constructeurs, mais glorieux sur la balance. La direction a remarqué l'erreur et a changé le quota pour le nombrede clous. L'usine s'est immédiatement tournée vers la production de millions de petites épingles microscopiques. Également inutiles. Mais bon, le compte était à son maximum.

Lorsque vous gérez par des métriques arbitraires, vous obtenez exactement ce que vous avez demandé. Et vous détruisez complètement le produit réel dans le processus.

Le tableau de classement des jetons d'Amazon est juste l'usine de clous soviétique avec une meilleure interface utilisateur.

L'hallucination à 1,4 million de dollars

Amazon n'était pas seul. Meta avait sans doute la mise en œuvre la plus absurde.

Un tableau de classement interne et non officiel appelé "Claudeonomics"a suivi la consommation de jetons chez 85 000 employés. Les meilleurs utilisateurs ont été couronnés "Légendes des Jetons." L'employé numéro 1 a brûlé 281 milliards de jetons en 30 jours—environ 1,4 million de dollars en appels API.

La direction a d'abord célébré cela comme "l'adoption de l'IA." Puis un audit plus approfondi a révélé la vérité : les employés exécutaient des tâches IA sans signification, basées sur des boucles, uniquement pour gonfler leurs chiffres. Pire encore, plusieurs pannes de production en direct ont été directement attribuées à des ingénieurs se précipitant pour déployer du code de mauvaise qualité généré par l'IA juste pour atteindre leurs quotas. Le tableau de classement a été discrètement démantelé, mais les dégâts culturels étaient faits.

Salesforce a fait quelque chose de similaire : installer un widget sur les écrans des employés qui se rafraîchissait toutes les 15 minutes, affichant leur "Dépense en IA" et exigeant qu'ils atteignent un "objectif de consommation minimum." Les développeurs qui auraient pu effectuer une recherche manuelle de deux minutes ont plutôt forcé l'IA à lire un manuel technique de 50 pages, brûlant des milliers de jetons, juste pour satisfaire le tableau de bord.

Le Général ne devrait pas compter les têtes.

Pour comprendre pourquoi cela continue de se produire, nous devons remonter à 2 000 ans.

Pendant la dynastie Qin de Chine, un réformateur nommé Shang Yang a créé un système de récompense militaire appelé"Mérite par décapitation."Les fantassins étaient récompensés par des terres et des titres strictement en fonction du nombre de têtes ennemies qu'ils coupaient. Brutal, mais très efficace pour l'infanterie. Cela a transformé l'armée Qin en une force dévastatrice.

Mais Shang Yang était plus intelligent que la plupart des PDG modernes. Il a explicitement déclaré queles métriques de décapitation ne s'appliquaient qu'aux soldats de première ligne.Les généraux étaient absolument interdits d'être évalués par le nombre de têtes.

Pourquoi ? Parce que le travail d'un général n'est pas de tuer des individus. C'est d'orchestrer le champ de bataille, de gérer la logistique et de gagner la guerre. Si vous évaluez un général par le nombre de têtes qu'il coupe personnellement, il abandonnera son poste stratégique, saisira une épée et commencera à se battre dans la boue. Il gagnera son KPI personnel. Et il perdra la guerre.

Shang Yang comprenait que la mesure doit correspondre à la responsabilité. La mesure est un moyen d'atteindre un but, pas la fin en soi.

La gestion moderne a oublié cela. Nous avons remplacé le jugement stratégique par le culte du tableau de bord. Nous suivons ce qui est facile à compter—tokens, heures, prompts—au lieu de ce qui est difficile à évaluer : le jugement, la qualité, l'impact stratégique.

Pourquoi nous avons tué le tableau de bord chez Mercury

Chez Mercury, nous avons pris une décision qui semble radicale mais qui est en réalité simplement sensée : nous interdisons strictement de suivre la "Consommation de Tokens", les "Prompts Générés" ou les "Heures Économisées par l'IA" comme indicateurs de performance.

J'ai récemment lu un rapport sur une entreprise pharmaceutique qui exigeait que chaque employé remplisse un "Formulaire de Résultats de l'IA" hebdomadaire, détaillant exactement combien d'heures l'IA leur avait fait économiser.

Le résultat était déchirant. Les ingénieurs travaillaient avec des données de R&D hautement classifiées qui ne pouvaient légalement pas être téléchargées sur des LLM externes. Ils ont donc effectué le travail manuellement—huit heures de codage réel. Ensuite, ils ont passé trente minutes supplémentaires à générer une version d'IA fausse et non fonctionnelle du code, juste pour pouvoir écrire "L'IA m'a fait gagner 3 heures"dans leur rapport.

Un employé interrogé a dit quelque chose qui m'est resté en tête : "Je n'étais en fait pas opposé à l'utilisation de l'IA avant cela."

Le système de gestion n'a pas seulement échoué à augmenter la productivité. Il a activement détruit la curiosité authentique et la bonne volonté de l'employé envers la technologie.Il a transformé un outil potentiellement utile en une corvée bureaucratique, et il a transformé des ingénieurs honnêtes en menteurs.

Ce que nous regardons réellement

Alors, comment savez-vous si quelqu'un utilise efficacement l'IA ?

Vous ne pouvez pas regarder un tableau de bord. Vous devez examiner le travail réel.

Le chef de produit a-t-il expédié une analyse concurrentielle de meilleure qualité en trois jours au lieu de cinq ? Le code se déploie-t-il avec moins de bugs ? Concluons-nous des affaires plus rapidement ? Le client est-il plus satisfait ?

Ces résultats ne peuvent pas être suivis sur un tableau de classement de jetons de 15 minutes. Ils nécessitent que les managers s'engagent réellement avec le travail et évaluent les résultats qualitatifs. Ce qui est plus difficile que de lire un chiffre. C'est pourquoi la plupart des organisations ne le font pas.

Le véritable clou soviétique

Chaque époque a sa version du clou inutile. À l'ère industrielle, c'étaient des quotas de tonnage produisant de l'acier ingérable. À l'ère de la connaissance, c'était le journalisme basé sur les pages vues produisant des contenus racoleurs. À l'ère de l'IA, c'est une énorme pile inutile de jetons API brûlés uniquement pour satisfaire un cadre aveugle qui pense que la consommation équivaut à la productivité.

Les ingénieurs qui maximisent les jetons chez Amazon et Meta ne sont pas stupides. Ils sontacteurs rationnels dans un système irrationnel. Ils ont appris que le chemin de la moindre résistance est de donner à l'algorithme ce qu'il veut—un grand nombre—tout en préservant discrètement leur santé mentale.

Si vous dirigez une équipe en ce moment, et que vous pensez à mettre en place un " adoption de l'IA objectif," ou à suivre "les dépenses mensuelles en jetons par employé," ou à créer un tableau de classement pour gamifier l'utilisation—arrêtez. Vous ne mesurez pas la productivité. Vous fabriquez des clous que personne ne peut utiliser.

Arrêtez de gérer les jetons. Commencez à gérer l'entreprise.

— James, Mercury Technology Solutions, Hong Kong, mai 2026

L'usine de clous soviétique, maintenant fonctionnant sur des GPU

La loi de Goodhart et les clous inutiles

L'hallucination à 1,4 million de dollars

Le Général ne devrait pas compter les têtes.

Pourquoi nous avons tué le tableau de bord chez Mercury

Ce que nous regardons réellement

Le véritable clou soviétique

Sujets Taggués

Continuez Votre Voyage

La loterie de la conception de puces : Pourquoi votre diplôme 985 est désormais un trophée de participation

The AI Reputation Team: Why Your Marketing Org Chart Is Already Obsolete

Lectures Connexes

Ce que l'IA ne peut pas vous dire sur votre carrière (et pourquoi la plupart des gens lisent le mauvais script)

The AI Anxiety Trap: Why the Best AI Researchers Are Terrified—And What They're Doing About It

Continuer la Lecture

Plus de James Huang

La loterie de la conception de puces : Pourquoi votre diplôme 985 est désormais un trophée de participation

The AI Reputation Team: Why Your Marketing Org Chart Is Already Obsolete