在过去一年中,商业叙事很简单:尽可能快地将AI交到员工手中。竞争已经开始。工具是神奇的。未来就在眼前。
但最近,董事会发生了巨大的转变。蜜月期正式结束。账单已经到达。
根据最近的报告,早期采用者如亚马逊、沃尔玛、思科、优步和Meta正在积极限制内部AI使用。并不是因为技术失败,而是因为他们查看了服务器账单,意识到自己不小心创造了一个财务怪物。
当我们帮助企业应对 数字化转型 时,理解这一现象发生的原因以及如何避免 代币陷阱 是至关重要的。
代理的崛起(以及固定费率计费的终结)
一段时间以来,我们都被训练成认为人工智能是便宜的,甚至是免费的。但计算从来不是免费的。
初始成本是通过固定费率订阅模型来补贴的。你每月支付二十美元,就可以无限制访问前沿模型。这感觉像是个划算的交易。但随着像OpenAI和Anthropic这样的人工智能实验室转向基于使用的 每代币计费人工智能的真实成本正在被揭示。
对于外行人来说,令牌是AI模型处理的数据的基本单位。你发送的每一个词,接收到的每一个词,以及其中的每一个推理步骤——都是令牌。而且它们的数量迅速增加。
这种计费转变与技术演变同时发生:从聊天机器人到AI代理的飞跃。
聊天机器人等待你的提示,回答后就进入休眠状态。AI代理是自主的。它循环运作。它推理。它执行复杂的工作流程并触发其他代理。正如思科首席产品官Jeetu Patel所指出的,部署代理需要成倍增加的基础设施。每一个人类员工可能突然有十个、一百个,甚至一千个AI代理在后台不知疲倦地工作。
计算资源的消耗令人震惊。
企业现实检查:到四月就烧掉2026年的预算
当技术变成玩具而不是工具时,预算就会蒸发。
采取 Workato ,一家看到人工智能使用在其1300名员工中传播 “如野火般” 的软件公司。当Anthropic在五月份转向按令牌计费时,Workato的成本在第一天就激增 7倍。 他们的首席信息官的反应? “天哪,我们造了个怪物。”
优步 面临类似的危机。他们的首席运营官承认,越来越难以将巨额的代币支出与实际的消费者功能产出相匹配。情况失控,以至于优步在今年四月之前就耗尽了其2026年分配的全部人工智能预算。他们现在将每位员工的代币支出上限设定为每月1500美元。
在 亚马逊 ,工程师们正在构建代理,仅仅是为了在内部生产力排行榜上攀升。管理层不得不介入,并明确警告团队停止使用 “为了人工智能而进行人工智能。”
这个模式很明显。失控的人工智能采用,加上按代币计费和自主代理,造成了成本的爆炸,超出了任何可衡量的回报。
生活黑客:AI金融责任 及模型路由
那这是否意味着人工智能革命正在停滞?绝对不是。这意味着行业正在成熟。我们正进入 AI金融责任 。
如果您是一位整合人工智能的商业领袖,这里有一本操作手册可以帮助您避免让IT部门破产。
1. 不要用法拉利去买菜
您不需要为每一个任务都使用绝对最昂贵的前沿模型——GPT-4o、Claude 3.5 Sonnet,或者本周的任何尖端技术。
黑客技巧:实施模型路由。评估任务的适合性和目的。如果员工正在总结一封基本的电子邮件,将该查询路由到一个较旧、成本较低的模型。将高端令牌留给复杂的编码、深度战略推理或高风险的创意工作。将马力与高速公路匹配。
利用本地和开源模型
为了削减巨额的云AI账单,公司越来越多地要求员工使用在公司服务器上或直接在员工设备上运行的开源模型。如果你控制基础设施,就可以停止向第三方实验室支付令牌费用。前期设置成本确实存在,但长期节省是可观的。
关注全球市场
数据显示,中国的AI实验室目前提供的令牌价格显著低于美国同行,这得益于更便宜的能源和高效的模型。这一成本优势使他们的令牌消费量大幅激增。在构建你的技术栈时,关注全球定价动态。最便宜的令牌不一定是最好的令牌,但了解市场走向是值得的。
可持续地加速数字化
到头来,真正的数字化转型 并不是盲目采用。它是关于将尖端技术与实际业务效率对齐。
不要让错失机会的恐惧迫使你给团队一张空白支票来购买计算能力。定义投资回报率。将模型与任务匹配。对你的技术栈保持严格的治理。
人工智能革命没有减速。它只是成熟了。而成熟意味着学会在预算内生活。
保持领先于潮流——并控制预算。
— 詹姆斯


