J'ai récemment construit un système qui oblige plusieurs modèles d'IA à débattre avant de répondre à une invite. Cela a pris une heure. C'est légèrement terrifiant. Et c’est peut-être la chose la plus importante que j’ai construite cette année.
Laissez-moi vous expliquer pourquoi.
Le piège du modèle unique : assurément faux
Tous les consultants en IA et architectes système ont été témoins de ce cauchemar. Cela se joue de la même manière à chaque fois.
Un modèle d'IA recommande une architecture logicielle spécifique. Le client le construit. C’est fondamentalement imparfait.Résultat : une réécriture à 50 000 $.
Un modèle d'IA dit :"Oui, cette expression régulière est sûre."L'équipe le déploie en production.Résultat : une faille de sécurité massive.
Un modèle d’IA suggère une nouvelle approche de conformité. Le régulateur audite l’entreprise.Résultat : une amende d'un million de dollars.
Les modèles uniques, aussi avancés soient-ils, présentent des angles morts inhérents. Ils ne savent pas ce qu’ils ne savent pas. Plus dangereux encore, aucune équipe rouge interne ne conteste leurs résultats.
Le plus grand risque actuel dans la technologie d’entreprise n’est pas que l’IA se trompe. Le fait est que l’IA aura certainement tort si personne ne vérifie son travail.
La solution : délibération contradictoire
Au lieu de m'appuyer sur un seul oracle omniscient, j'ai construit un système qui réunit unconseil d'administration-un conseil composé de plusieurs LLM distincts obligés de débattre d'un problème avant de fournir une réponse à l'utilisateur.
Voici à quoi ressemble une véritable délibération au sein du système :
Round 1 (La proposition) :Kimi K2.7 propose,"Utilisez les événements envoyés par le serveur pour cette fonctionnalité. C'est plus simple et plus léger."
Round 2 (La Critique) :Claude Opus 4.8 soutient,"Vous avez raté la dette à double protocole. La plupart des tableaux de bord finissent inévitablement par nécessiter des fonctionnalités bidirectionnelles. SSE nous gênera."
Round 3 (La réfutation) :Kimi K2.7 répond,"C'est un argument valable. Mais l'abstraction du transport résout ce problème : nous pouvons implémenter SSE maintenant pour plus de rapidité, et passer de manière transparente à WebSocket plus tard sans réécriture massive."
Le résultat :Aucun des deux modèles n’a techniquement gagné. Au lieu de cela, le conseil a proposé une troisième option très nuancée avec laquelle aucun des deux modèles n’avait débuté.
Il ne s'agit pas d'un système de vote. Il ne s’agit pas de prendre la moyenne de trois résultats. C'estdésaccord structuré et contradictoirecela fait remonter à la surface les véritables critères de décision.
Comment fonctionne le Conseil
Ce système modifie l’économie de l’unité et le profil de sécurité du déploiement de l’IA. Voici ce que l’architecture réalise :
Routage intelligent des coûts.Il achemine les requêtes simples et à faibles enjeux vers le modèle performant le moins cher. Demander"Quel temps fait-il ?"coûte 0,0006 $. Pas besoin de graver des jetons premium pour des quiz.
Escalade intelligente.Il fait automatiquement passer les décisions complexes et à enjeux élevés à la phase de débat multimodèle. Une révision rigoureuse de l'architecture peut coûter 0,09 $. C’est une assurance bon marché contre une réécriture de 50 000 $.
Décomposition des tâches.Il brise les tâches massives et ambiguës, comme"concevoir une plateforme fintech mondiale"- en cinq à sept étapes spécialisées gérées par des personnages d'agent spécifiques. Aucun modèle ne s’étouffe avec la lunette.
Transparence radicale.Il fait apparaître des opinions dissidentes accompagnées de scores de confiance. Il ne cache jamais les désaccords sous le tapis. Si les modèles ne sont pas d’accord, vous voyez exactement où et pourquoi.
Pistes d'audit immuables.Il génère un historique complet et traçable de qui a dit quoi et pourquoi une décision a été prise. Lorsque le régulateur le demande, vous avez la transcription.
Le kicker ? L'ensemble de ce système fonctionne sur desOpenClaw primitives.Cela ne nécessite aucune nouvelle infrastructure propriétaire. Il s'agit d'une configuration pure et d'une ingénierie rapide avancée.
Le véritable aperçu : la gouvernance plutôt que la puissance
Le principal point à retenir de cette expérience n’est pas d’atteindrebetter AI.It is aboutAI governance.
Pensez à la manière dont la société humaine gère les décisions à enjeux élevés :
- Les tribunaux ont une poursuite et une défense.
- La science nécessite un examen rigoureux par les pairs.
- Les entreprises sont guidées par des conseils d'administration.
- La médecine s'appuie sur des deuxièmes avis.
Pourquoi diable les décisions assistées par l’IA – des décisions affectant de plus en plus les vies humaines et la survie des entreprises – devraient-elles être moins rigoureuses que les décisions humaines ?
La vision de l’avenir du travail
Ma vision de l’IA d’entreprise est stricte :
Aucune IA ne devrait prendre à elle seule des décisions affectant des vies humaines sans délibération structurée.
Chaque décision automatisée doit montrer son raisonnement, son niveau de confiance et toute opinion dissidente.
Les pistes d’audit sont strictement non négociables.
Le coût de calcul est une contrainte et non un objectif ultime.
Ce modèle de conseil est portable. Il apparaît comme une nouvelle norme. Et surtout, il est open source. Cela ne résout pas parfaitement le problème des hallucinations, mais cela le résout de manière mesurable, transparente et à moindre coût.
Si vous souhaitez créer des ponts entre l’IA et l’humain auxquels votre entreprise peut réellement faire confiance, arrêtez de demander la réponse à un modèle unique.Commencez à créer un conseil.
Le système complet est open source et prêt à être installé sans aucune dépendance : uniquement Python.
Check it out on GitHub:https://github.com/james-mtsoln/llm-council
Stay ahead of the curve.
— James


