一场围绕AI使用量的竞赛正在科技行业内部引发激烈争议。工程师们竞相消耗尽可能多的AI token,以证明自己对人工智能工具的拥抱程度,这一现象被称为"tokenmaxxing"。然而,随着这股风潮迅速蔓延,其背后的效率逻辑与潜在风险也同步暴露。
据The Information最新报道,Meta内部一名员工搭建了一个名为"Claudeonomics"的非官方排行榜,追踪员工的token消耗量,并设有"Token Legend"(Token传奇)等荣誉称号。
排行榜显示,排名最高的个人用户在30天内平均消耗了2810亿至3285亿个token,按公开定价折算,费用可能接近200万美元。该排行榜在The Information报道发出后两天内即遭下线。Meta方面表示,公司不主张将个人token数据作为评估绩效的主要方式。
这一事件迅速点燃了科技圈的讨论。支持者认为token消耗量是衡量员工拥抱AI工具的有效信号,批评者则警告这一指标可能催生系统性造假行为,并给企业IT预算带来难以控制的风险。与此同时,据金融科技公司Ramp援引Gartner数据,过去一年企业月度AI支出已翻了四倍,tokenmaxxing现象折射出的AI成本管控问题正成为CFO们的新难题。
Token:AI时代的新“货币”
要理解tokenmaxxing,首先需要了解token的本质。大型语言模型将文字拆解为数值输入,每个token约相当于四分之三个英文单词。OpenAI和Anthropic等AI公司的商业模式几乎完全建立在token计费之上——月度订阅用户有token使用上限,通过API接入的企业则按月度token用量付费。
随着Claude Code、Codex等AI编程工具的普及,以及OpenClaw等全天候AI助手的兴起,企业token消耗量急剧攀升。Ramp产品负责人兼创始工程师Calvin Lee表示,今年以来企业AI token支出已大幅跃升。Ramp将这一现象称为企业的"万亿美元盲区"。
Token也逐渐演变为一种身份象征。创始人和工程师们在X平台上晒出自己的token消耗数据,以彰显对AI的全力押注。Y Combinator CEO Garry Tan公开表态:"我们tokenmaxxing的时间比大多数人都长。"英伟达CEO黄仁勋则在All-In播客上表示,如果一名年薪50万美元的工程师一年内消耗的token价值不足25万美元,他会"深感警惕"。
Meta“Claudeonomics”:一场迅速熄灭的竞赛
Meta这场内部token竞赛的规模远超外界想象。在排行榜下线前,Meta全公司30天内的token总消耗量已从6.02万亿攀升至73.7万亿。员工们为冲榜采取了各种手段:设计更长的提示词、并行运行多个AI代理,甚至部署会议转录机器人——因为谁开发了工具,谁的token消耗量就会相应增加。
据The Information援引多名Meta员工的说法,部分工程师还指示AI代理生成大量细碎的代码变更,这些变更对功能改善毫无意义,却能拉高token消耗统计。另有员工在内部论坛写道:"我邀请大家粗略估算一下这背后的能耗,如果不是如此荒诞,真是令人痛心。"
Meta发言人表示,公司通过内部AI系统Checkpoint追踪员工绩效时,token使用量只是众多数据点之一,官方仪表盘AI Insights还包含代码相关指标及其他维度的洞察。但据The Information,部分Meta员工认为公司在这一问题上发出了混乱的信号。
系统性造假:从Meta到亚马逊
tokenmaxxing引发的"刷数据"行为并非Meta独有。据The Information援引知情人士,亚马逊电商部门去年底曾有一名经理要求团队更多使用AI编程工具,随后有工程师编写代码,使每次与AI编程工具Cline的对话看起来消耗了正常情况下10倍的token,该团队因此跃升为亚马逊某部门AI使用量最高的团队之一。这一作弊手段在今年初被亚马逊系统修复后失效。亚马逊发言人表示,公司不设定也不鼓励此类目标。
Khosla Ventures合伙人Jon Chu在X平台上将token消耗量作为考核指标的做法称为“绝对愚蠢的政策”,并表示他在Meta的朋友告诉他,已有人专门搭建机器人循环运行以快速消耗token。“The Pragmatic Engineer”通讯作者Gergely Orosz则直言:"开发者会对任何与奖金或晋升挂钩的目标进行钻营,这次也不例外。"
企业界的另一条路:以结果而非消耗论英雄
面对tokenmaxxing的争议,科技行业之外的企业正在探索更务实的AI激励路径。
执法设备制造商Axon为员工提供现金奖励,条件是团队超额完成年度路线图目标至少15%。Axon总裁Josh Isner表示,公司约2000名软件工程师今年有望整体超额完成目标30%,主要得益于AI编程工具的使用,公司在Claude Code和Cursor上的支出预计将达到"数千万美元"量级。
Isner明确表示,以token消耗量评估员工不符合Axon的目标导向。“当你只是引入'尽可能多地使用这个工具,我们就付钱给你'这样的衡量标准时,风险越来越大,”他说,"你怎么知道自己得到了想要的结果?"
Box CEO Aaron Levie则将AI带来的生产力预期收益直接纳入产品路线图的目标设定,员工能否达成这些更高目标将直接影响薪酬。Levie表示,他不鼓励tokenmaxxing,也不认为这一趋势会在硅谷以外的大型企业中广泛蔓延。
度量困境:token是信号,但不是答案
争议的核心在于:token消耗量究竟能衡量什么?
Cursor员工Edwin Wee Arbus将其比作BMI指数——"有用的快速代理指标,但存在缺陷",能提供健康参考,却无法反映肌肉或骨密度。Persona软件工程师Arush Shankar则表示:"token消耗始终是输出而非输入,值得关注,但绝不能孤立看待,它是一个信号,但不是唯一信号。"
Linear COO Cristina Cordova的批评更为直接:"按token消耗量给工程师排名,就像我按谁花钱最多来给营销团队排名一样。不要把高消耗率误认为高成功率。"
Ramp的Calvin Lee指出,token的价值高度依赖具体使用场景——一个陷入循环的邮件分类代理可能消耗大量token却毫无产出,而另一名工程师用更少的token修复了关键漏洞。更棘手的是,企业从AI模型提供商收到的API账单通常缺乏足够的颗粒度,难以追溯具体使用场景。为此,Ramp推出了AI Spend Intelligence平台,帮助财务团队统一管理API和订阅数据,并按员工、产品或业务流程拆解token使用情况,设定预算上限。
tokenmaxxing的兴衰,折射出AI时代企业管理的深层困境:当一种全新的生产工具以前所未有的速度渗透工作流程,如何建立有效的激励机制而非制造新的"内卷",仍是摆在每一家企业面前的未解之题。




