老黄的Token经济学翻车了!微软亚马逊通通跳车

量子位
企业AI支出正从狂热转向理性。一家神秘公司月耗5亿美元Claude账单,亚马逊则因员工为冲榜滥用AI而取消内部工具排行榜。微软收缩Claude Code授权,Uber四个月烧光全年预算。黄仁勋“多用Token即省钱”的Token经济学,正被一张张巨额账单和低ROI的现实挑战。

Token经济学,可能并不经济。

(除了AAAAA显卡黄总)

最近,Axios爆出一个挺逆天的事儿:一家企业,一个月就烧掉了5亿美元的Claude账单,合人民币34亿元。

原因嘛,就是老板给员工开通了Anthropic的企业授权之后,忘了设置用量上限,然后token就一直烧烧烧……

烧了一个月,34个小目标就这么水灵灵地出去了。

咱先不说烧得值不值,如果按Anthropic目前约470亿美元的年化收入(ARR)计算,相当于这一家公司,一个月就贡献了Anthropic接近八分之一的月收入

换句话说,Anthropic每赚8块钱,其中就有1块来自这家公司。

更夸张的是,这家公司至今没有公开身份。

但Axios在报道里提到,能够“无痛”吞下5亿美元AI账单的企业,全球其实也没多少家。

很快,X上开始出现各种猜测,其中被点名最多的是亚马逊。

巧的是,就在几乎同一时间,《金融时报》披露,亚马逊已经取消内部AI使用排行榜,因为员工开始为了冲榜而疯狂刷Token,甚至执行大量没有实际价值的任务。

这一前一后两条新闻放在一起看,味道就有点不一样了。

过去两年,企业最担心的是员工不用AI。而现在,越来越多企业开始担心另一件事:

AI是不是用得太多了。

美国大厂,开始算账了

这种变化,最近正在越来越频繁地出现。

微软就是一个典型例子。

最近,微软宣布将在6月30日之前取消Experiences + Devices部门(负责Windows、Microsoft 365、Outlook、Teams、Surface)的大部分Claude Code授权,工程师们被要求迁移到自家的GitHub Copilot CLI。

而Claude Code进入微软内部,距离现在不过6个月。

微软给出的理由很符合硅谷传统——

Claude Code已经完成了帮助团队学习和探索的阶段,是时候回到“Eat Your Own Dog Food”,使用自己的产品了。

但无论如何,Token账单都是绕不开的话题。

类似的变化,也出现在DeepSeek身上。

今年4月发布V4时,DeepSeek在技术报告里提到,V4已经成为公司内部员工日常使用的Agentic Coding模型,体验优于Claude Sonnet 4.5,交付质量接近Opus 4.6。

虽然官方没有明确提及成本因素,但对于拥有自研模型的公司来说,用自己的模型完成同样的工作,显然是一个更经济的选择。

如果说微软和DeepSeek还算委婉客气,那么Uber则说得更加直接。

Uber CTO Praveen Neppalli Naga今年早些时候透露,公司工程师仅用4个月就烧完了全年Claude Code预算。

随后,Uber首席运营官Andrew Macdonald公开表示:AI Token消耗与最终发布的有价值产品之间,似乎并不存在明显的线性关系。

换句话说,花掉更多Token,并不一定意味着创造出更多价值。

类似的反思,也开始出现在更多公司内部。

此前,多邻国曾计划将AI使用情况纳入员工绩效考核。但在员工质疑“是否必须为了使用AI而使用AI”之后,公司最终撤回了这一决定。

“感觉我们不是在为实际结果负责,而是在试图强推一些并不总是适合的东西。”

今年4月的一档播客中,多邻国CEO路易斯·冯·安如此总结。

Meta的变化则更具代表性。

在被曝出内部建立Claude使用排行榜、单月消耗数十亿Token后,Meta也逐渐开始收紧相关激励,从鼓励“多用、多刷”,转向更关注实际产出。

与此同时,国内也出现了类似声音。

米哈游郑银河曾分享过一次经历:某个Agent项目上线后,一晚上烧掉了200万元Token费用。

这笔学费不算便宜。但它也让越来越多企业意识到一个问题:Token本身并不是价值,完成任务、交付产品、创造收入,才是价值。

可以说,企业依然相信AI,只是相比去年,它们开始不再单纯追求消耗更多Token,而是开始认真计算每一个Token背后的ROI。

AI第一次变成了财务问题

毫无疑问,在经历了大半年的“黄氏Token经济学”之后,美国大厂开始认真反思:

这些Token,到底花得值不值?

今年3月,黄仁勋在《All-In Podcast》中曾为这套逻辑公开背书。

如果一个年薪50万美元的工程师每年消耗的token不到25万美元,他会深感担忧。

在当时,这句话被很多企业奉为圭臬。

毕竟,如果AI真的能提升工程师效率,那么多烧一些Token,本质上是在购买生产力。

用的越多,省得越多就是这么来的。

但问题在于:当一张张真实账单开始寄到企业手里时,事情开始变得没那么简单。

无论是Amazon取消排行榜,微软收缩Claude Code授权,还是Uber发现工程师4个月烧光全年预算。

老板们最终还是选择了用脚投票。

最近,关于这件事的讨论也开始在Hacker News上发酵。

有人认为,这是一个重要转折点。

过去那种把Token消耗量等同于AI采用率、甚至等同于生产力的狂热阶段,正在结束。

也有人把矛头直接指向了过去半年流行的“Tokenmaxxing”文化。

(注:Token是大语言模型处理文本的基本单位,也是计费单位。Tokenmaxxing指的是企业和员工疯狂追求token消耗量,把“烧了多少token”当成AI采用率和生产力的衡量指标。)

在他们看来,问题并不在于AI,而在于企业把“烧更多Token”误当成了目标本身。

如果使用更高效的模型、合理控制Agent工作流,或者让人类参与关键决策,成本本可以低得多。

当然,也有人开玩笑说:

这场运动最大的赢家,从头到尾可能只有黄仁勋。

不过,另一种观点同样值得关注。

不少开发者认为,这并不是AI热潮退去的信号。

恰恰相反。

这意味着企业终于开始从“先用再说”,进入“精细运营”的阶段。

未来大家关注的重点,可能不再是谁烧掉更多Token,而是谁能用更少的Token完成更多任务。

比如:更高效的Agent工作流;廉价模型处理简单任务;昂贵模型只负责关键决策;更严格的预算和权限管理。

本文来源:量子位

风险提示及免责条款
市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。
相关文章