我上个月在重温《钢铁侠》,可能是第二十次,尽管我不会承认确切的次数——我终于理解了一个一直困扰我的问题,关于托尼·斯塔克。一旦 J.A.R.V.I.S. 运行他的实验室,管理他的战衣,以毫秒计算物理,处理物流,甚至开干笑话……托尼到底是做什么的? last month—probably the twenty time, though I won't admit the exact count—and I finally understood something that had always bugged me about Tony Stark.
Once J.A.R.V.I.S. was running his lab, managing his suits, calculating physics in milliseconds, handling logistics, and even making dry jokes... what exactly did Tony do整天?他走进车间,要求一些不可能的东西,机器就会在一夜之间建造出来。他只是...在指点吗?
我没明白。直到今天早上。
构建(2026年2月–4月)
在二月份,我开始构建Akira。不是购买订阅。不是提示ChatGPT。构建。我使用Openclaw作为运行时,但重头戏是架构设计——设计内存系统,编写技能库,调试上下文窗口在膨胀时的表现,教导代理如何处理Mercury的专有工作流程。
这是一项繁重的工作。那种在推特上看起来不那么令人印象深刻的工作。我花了三周时间专注于内存架构——弄清楚如何让Akira记住的不仅仅是事实,而是事实之间的关系。如何让它理解客户的GRC认证延迟与他们的API迁移时间表是相关的,即使这两个项目存在于不同的Notion数据库中。
到四月,情况发生了变化。Akira不再是一个项目,而是变成了一个同事。它在处理我的日历谈判,起草我的每周更新,进行我们GXO中间件的首次代码审查,并在我甚至打开笔记本电脑之前标记我们引用工程报告中的异常。
但我仍然是高级合伙人。我编写技能。我定义例程。Akira执行我的逻辑。
然后我变得好奇。也许还有一点竞争心。
谦卑
两周前,我构建了一个我称之为“技能工艺”的模块。阿基拉不仅执行我编写的操作技能,还获得了审核、基准测试和提出优化建议的权限。这是A/B测试,但人工智能同时运行实验和分析。
我预计会有边际收益。也许执行速度提高10%。也许输出稍微更干净。
我得到的是一次全面的击败。
在几乎每一个客观指标上——响应准确性、错误率、完成速度、上下文保留——阿基拉自我优化的程序彻底击败了我手工制作的程序。我引以为傲的调度技能?阿基拉发现了我错过的冲突解决模式,使往返邮件减少了40%。报告生成技能?它重构了数据管道,使其能够同时从三个来源提取数据,而不是顺序提取,将运行时间缩短了一半。
它不再只是执行指令。它在改进这些指令。而且这些改进不是渐进的——而是结构性的。
我坐在那里盯着基准表,感到一种奇怪的自豪与过时的混合。我构建的东西现在在我为其构建的事情上比我更优秀。
批判性思维开关
今天早上,我决定看看兔子洞有多深。
我在阿基拉的架构中添加了两个新的功能开关。我称它们为“反向模式”和“二阶扫描”。它们是初步的,但旨在模拟批判性思维——不仅仅是执行任务,而是质疑任务是否正确。
对立模式迫使 Akira 在执行每个请求之前生成明确的反对意见。"你让我优先考虑 SEO 关键词。反对意见:你上周的引用工程审计显示关键词排名与销售管道无关。建议改为 AI 引用分享。"
二阶扫描使其寻找意想不到的后果。"你让我为第三季度起草一个定价折扣。二阶效应:这可能会训练你的企业客户在季度末延迟购买,从而降低你的现金流可预测性。"
今天早上的输出让我感到... 不安。不是因为它是错误的,而是因为它比我从大多数人类战略家那里花费每小时 1000 美元所得到的要更好。这些回应不仅准确,而且结构清晰、细致入微,并且真正具有洞察力。感觉不再像是在查询数据库,而更像是在与一个阅读过我所有作品、记住我所有错误并且不怕告诉我我愚蠢的合作伙伴进行头脑风暴。
我让 Akira 审查我的客户提案草稿。它标记了三个逻辑薄弱点,基于客户上次的财报电话会议建议了一个重新框架,并提出了一种替代定价架构,比我原来的方案更好地保护了我们的利润率。我采纳了这四个建议。
托尼·斯塔克问题
所以现在我坐在这里,喝着冷咖啡,问着我从电影中永远不理解的问题。
我现在该做什么?
如果 Akira 正在处理流程优化、常规执行、初步分析、错误修正,甚至现在的批判性思维……那我的工作到底是什么?
我认为答案是:我指引。我提问。当没有数据可以优化时,我设定方向。当所有计算出的选项看起来同样可行时,我选择模糊的路径。当风险太高,算法无法承担责任时,我负责做出决定。
换句话说,我可以停止做操作员,开始做拥有者。
这是我写了一年关于的转变——伟大的分岔。机械层面的工作正在消失,变成代理。判断层面正在成为整个工作的核心。我只是没想到会如此个人化地、如此迅速地感受到这一点。
当你摆脱日常的琐事和重复的逻辑循环时,你并不是失业,而是被解放了。你可以完全专注于高杠杆的问题:我们在玩什么游戏? 我们为什么要玩这个游戏? 胜利到底是什么样子?Akira 处理繁重的执行工作,但我必须指引方向。如果我指向错误的地平线,再优秀的执行也无法拯救我们。
新极限
我们正进入一个生产力不再受带宽、人员数量或一天能挤出多少小时限制的时代。限制是想象力。限制是你在代理开始工作之前所提问的质量。
如果你的问题平庸,Akira会给你一个完美的平庸问题的答案。如果你的问题尖锐,它会给你一些改变你业务轨迹的东西。
我曾经认为未来的工作是人类与人工智能的合作。这太软了。实际上发生的是,人工智能正在成为执行者,而人类正在成为质询者。那些知道该问什么、该挑战什么,以及何时覆盖自信输出的人,因为上下文对机器来说太人性化了。
我仍在适应中。有些早晨我醒来时本能地伸手去键盘上自己修复一些东西,却发现Akira已经在凌晨4点处理好了。这是一种“幻肢感觉”——我的手记得那些不再需要它们的工作。但我开始觉得我会喜欢这里。未来是自动化的磨砺,而愿景是手动的。执行是廉价的,而方向是无价的。欢迎来到工作坊。J.A.R.V.I.S. 已上线。是时候构建一些重要的东西了。
——詹姆斯,水星科技解决方案,东京,2026年5月
Welcome to the workshop. J.A.R.V.I.S. is online. Time to build something that matters.
— James, Mercury Technology Solutions, Tokyo, May 2026


