老黄的Token经济学翻车了！微软亚马逊通通跳车

量子位

06/01 19:13

企业AI支出正从狂热转向理性。一家神秘公司月耗5亿美元Claude账单，亚马逊则因员工为冲榜滥用AI而取消内部工具排行榜。微软收缩Claude Code授权，Uber四个月烧光全年预算。黄仁勋“多用Token即省钱”的Token经济学，正被一张张巨额账单和低ROI的现实挑战。

Token经济学，可能并不经济。

（除了AAAAA显卡黄总）

最近，Axios爆出一个挺逆天的事儿：一家企业，一个月就烧掉了5亿美元的Claude账单，合人民币34亿元。

原因嘛，就是老板给员工开通了Anthropic的企业授权之后，忘了设置用量上限，然后token就一直烧烧烧……

烧了一个月，34个小目标就这么水灵灵地出去了。

咱先不说烧得值不值，如果按Anthropic目前约470亿美元的年化收入（ARR）计算，相当于这一家公司，一个月就贡献了Anthropic接近八分之一的月收入。

换句话说，Anthropic每赚8块钱，其中就有1块来自这家公司。

更夸张的是，这家公司至今没有公开身份。

但Axios在报道里提到，能够“无痛”吞下5亿美元AI账单的企业，全球其实也没多少家。

很快，X上开始出现各种猜测，其中被点名最多的是亚马逊。

巧的是，就在几乎同一时间，《金融时报》披露，亚马逊已经取消内部AI使用排行榜，因为员工开始为了冲榜而疯狂刷Token，甚至执行大量没有实际价值的任务。

这一前一后两条新闻放在一起看，味道就有点不一样了。

过去两年，企业最担心的是员工不用AI。而现在，越来越多企业开始担心另一件事：

AI是不是用得太多了。

美国大厂，开始算账了

这种变化，最近正在越来越频繁地出现。

微软就是一个典型例子。

最近，微软宣布将在6月30日之前取消Experiences + Devices部门（负责Windows、Microsoft 365、Outlook、Teams、Surface）的大部分Claude Code授权，工程师们被要求迁移到自家的GitHub Copilot CLI。

而Claude Code进入微软内部，距离现在不过6个月。

微软给出的理由很符合硅谷传统——

Claude Code已经完成了帮助团队学习和探索的阶段，是时候回到“Eat Your Own Dog Food”，使用自己的产品了。

但无论如何，Token账单都是绕不开的话题。

类似的变化，也出现在DeepSeek身上。

今年4月发布V4时，DeepSeek在技术报告里提到，V4已经成为公司内部员工日常使用的Agentic Coding模型，体验优于Claude Sonnet 4.5，交付质量接近Opus 4.6。

虽然官方没有明确提及成本因素，但对于拥有自研模型的公司来说，用自己的模型完成同样的工作，显然是一个更经济的选择。

如果说微软和DeepSeek还算委婉客气，那么Uber则说得更加直接。

Uber CTO Praveen Neppalli Naga今年早些时候透露，公司工程师仅用4个月就烧完了全年Claude Code预算。

随后，Uber首席运营官Andrew Macdonald公开表示：AI Token消耗与最终发布的有价值产品之间，似乎并不存在明显的线性关系。

换句话说，花掉更多Token，并不一定意味着创造出更多价值。

类似的反思，也开始出现在更多公司内部。

此前，多邻国曾计划将AI使用情况纳入员工绩效考核。但在员工质疑“是否必须为了使用AI而使用AI”之后，公司最终撤回了这一决定。

“感觉我们不是在为实际结果负责，而是在试图强推一些并不总是适合的东西。”

今年4月的一档播客中，多邻国CEO路易斯·冯·安如此总结。

Meta的变化则更具代表性。

在被曝出内部建立Claude使用排行榜、单月消耗数十亿Token后，Meta也逐渐开始收紧相关激励，从鼓励“多用、多刷”，转向更关注实际产出。

与此同时，国内也出现了类似声音。

米哈游郑银河曾分享过一次经历：某个Agent项目上线后，一晚上烧掉了200万元Token费用。

这笔学费不算便宜。但它也让越来越多企业意识到一个问题：Token本身并不是价值，完成任务、交付产品、创造收入，才是价值。

可以说，企业依然相信AI，只是相比去年，它们开始不再单纯追求消耗更多Token，而是开始认真计算每一个Token背后的ROI。

AI第一次变成了财务问题

毫无疑问，在经历了大半年的“黄氏Token经济学”之后，美国大厂开始认真反思：

这些Token，到底花得值不值？

今年3月，黄仁勋在《All-In Podcast》中曾为这套逻辑公开背书。

如果一个年薪50万美元的工程师每年消耗的token不到25万美元，他会深感担忧。

在当时，这句话被很多企业奉为圭臬。

毕竟，如果AI真的能提升工程师效率，那么多烧一些Token，本质上是在购买生产力。

用的越多，省得越多就是这么来的。

但问题在于：当一张张真实账单开始寄到企业手里时，事情开始变得没那么简单。

无论是Amazon取消排行榜，微软收缩Claude Code授权，还是Uber发现工程师4个月烧光全年预算。

老板们最终还是选择了用脚投票。

最近，关于这件事的讨论也开始在Hacker News上发酵。

有人认为，这是一个重要转折点。

过去那种把Token消耗量等同于AI采用率、甚至等同于生产力的狂热阶段，正在结束。

也有人把矛头直接指向了过去半年流行的“Tokenmaxxing”文化。

（注：Token是大语言模型处理文本的基本单位，也是计费单位。Tokenmaxxing指的是企业和员工疯狂追求token消耗量，把“烧了多少token”当成AI采用率和生产力的衡量指标。）

在他们看来，问题并不在于AI，而在于企业把“烧更多Token”误当成了目标本身。

如果使用更高效的模型、合理控制Agent工作流，或者让人类参与关键决策，成本本可以低得多。

当然，也有人开玩笑说：

这场运动最大的赢家，从头到尾可能只有黄仁勋。

不过，另一种观点同样值得关注。

不少开发者认为，这并不是AI热潮退去的信号。

恰恰相反。

这意味着企业终于开始从“先用再说”，进入“精细运营”的阶段。

未来大家关注的重点，可能不再是谁烧掉更多Token，而是谁能用更少的Token完成更多任务。

比如：更高效的Agent工作流；廉价模型处理简单任务；昂贵模型只负责关键决策；更严格的预算和权限管理。

本文来源：量子位

风险提示及免责条款

市场有风险，投资需谨慎。本文不构成个人投资建议，也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资，责任自负。

老黄的Token经济学翻车了！微软亚马逊通通跳车

美国大厂，开始算账了

AI第一次变成了财务问题

特斯拉也开始Token“限流”

Claude Code 80%的提示词说删就删，Anthropic用Fable 5打了个样：AI行业的“降本”才刚刚开始

Fable 5解禁即翻车！写一行代码就降智，开发者破防

“框架”比“模型”本身对Agent成功的影响大7倍！“推理成本”和“部署效率”才是创业公司的核心竞争优势

Token调用量增长超10倍！豆包大模型2.1上线，Seedance 2.5预计7月初正式上线