高盛深度报告：即将到来的拐点——解码AI智能体经济

05-06 19:40

465

高盛估计，到2030年消费端AI代理可将全球token消耗量提升12倍，每月新增约60千万亿个token。底层算力成本的下降速度已超过token定价的降幅，超大规模云厂商和大模型提供商的毛利率拐点或将在未来3至12个月内到来。

智能体AI（Agentic AI）正在将人工智能行业从成本叙事转向利润叙事。高盛认为，随着token消耗量即将出现跃升式增长，而底层算力成本的下降速度已超过token定价的降幅，超大规模云厂商和大模型提供商的毛利率拐点或将在未来3至12个月内到来。

据追风交易台，高盛5月5日发布报告称，该行预计到2030年，消费端和企业端AI代理合计将推动全球token消耗量较2026年水平增长24倍，达到每月约120千万亿个token；若以2040年企业端代理达到峰值采用率计算，这一数字将进一步扩大至55倍。

与此同时，高盛的推断价格与成本曲线显示，主流大模型token定价已从此前每年约40%的降幅趋于稳定甚至小幅回升，而英伟达、AMD、谷歌TPU及Trainium等芯片驱动的每token算力成本仍在以每年60%至70%的速度持续下降，两条曲线的剪刀差正在为行业打开利润空间。AI基础设施的大规模资本开支，或将因利润率改善而获得更可持续的经济支撑。

Token经济学拐点：成本下降快于价格，利润空间正在打开

高盛报告的核心论点在于，AI行业正从"推理经济不确定、可能摊薄利润"的阶段，迈向"token增量以具吸引力的边际利润落袋"的新阶段。

在AI周期的第一阶段，投资者普遍将算力和token视为成本驱动因素——更多使用意味着更多推理负载、更多加速器、更多电力和更高资本开支。但高盛的推断价格与成本曲线表明，这一逻辑正在发生转变。

主流大模型token定价虽已大幅下降，但目前已趋于稳定，部分情形下甚至出现回升；与此同时，英伟达、谷歌TPU（博通）、AMD和Trainium（Marvell）的每token全成本仍在快速且持续地下降。若token定价稳定在高于token成本的水平，则智能体AI采用率的提升将带来正向利润扩张，而非仅仅是收入增长。

高盛进一步指出，智能体AI可能形成自我强化的经济飞轮：更低的每token算力成本催生更丰富、更复杂的代理；更丰富的代理通过更长的上下文、更多循环、更多验证和持续监控消耗更多token；更高的利用率改善AI基础设施的经济性，进而支持提供商持续投入模型质量和分发能力。高盛认为，这一飞轮与市场上"AI使用将带来不可持续成本负担"的主流叙事截然不同。

不过，高盛也提示风险：并非所有AI工作负载都能保证实现正向利润拐点。对于商品化程度较高的纯文本聊天机器人，竞争仍可能迫使token定价的下降速度快于算力成本。

消费端代理：从碎片化对话到"常驻"助手，token消耗将增12倍

高盛估计，到2030年消费端AI代理可将全球token消耗量提升12倍，每月新增约60千万亿个token。

报告将消费端代理分为两类：一是"按需型"代理，如OpenAI Operator、Claude Code等浏览器端代理，由用户发起任务后自主规划、执行并返回结果；二是"常驻型"代理，如持续在后台运行的邮件监控、日程管理或数字生活助手。高盛认为，最大的token消耗跃升将发生在代理从用户发起任务转向持续后台运行的阶段——代理持续监控上下文并在需要时主动行动。

从模拟数据来看，普通LLM聊天机器人每次会话消耗约1,000个token，嵌入式Copilot每天消耗超过5,000个token，而常驻型代理每天的token消耗量可超过100,000个。

高盛预计，到2030年每日AI查询量将从2025年的约50亿次增至约230亿次，其中最多30%将流向搜索、购物、旅行、邮件及个人生产力等领域的代理。与此同时，传统搜索引擎在查询量中的份额预计将从2025年的68%降至2030年的36%，LLM原生应用的份额则将从12%升至31%。

企业端代理：工作流复杂度驱动token强度，2040年消耗量或达55倍

高盛预计，企业端AI代理将成为最大的token乘数，到2030年推动全球token消耗量增长24倍，到2040年峰值采用时进一步增至55倍，届时企业端工作负载将占全球token总使用量的70%以上。

企业端代理之所以比消费端代理更具token强度，在于其工作流要求代理执行更复杂、更精确的操作——监控任务、检索上下文、推理异常、验证输出、更新系统并在整个工作日中持续上报问题。此外，企业代理往往涉及更重的多模态输入（语音、图像、文档、屏幕活动、应用数据、日志及结构化系统记录），这将显著提升token强度。

高盛通过构建模拟代理对不同职业的token消耗进行了量化测算。

结果显示，编程代理每天消耗约700万个token，API成本约为13美元/天，远低于人工成本，这解释了为何软件开发领域的代理采用速度最快；呼叫中心代理每天消耗约200万个token，但若依赖实时语音处理，成本可高达92美元/天，使全面语音自动化在经济上仍不具竞争力；数据录入代理每天消耗约2,500万个token，成本约为60美元/天，仍低于人工成本。

高盛指出，企业端代理的采用速度将取决于token量、API成本、模态组合和实施复杂度四个变量。以文本为主、工具生态成熟的工作流将率先规模化；以语音为主或深度集成后台系统的工作流则可能进展较慢。

从采用曲线来看，高盛认为企业端智能体AI最可能遵循S型曲线，预计峰值采用率约为35%至40%的知识工作者，达峰时间约为15年，快于历史技术扩散的中位数（29年）。

资本开支可持续性：利润改善为超大规模云厂商提供更大空间

高盛报告的一个关键投资结论是：超大规模云厂商利润率的改善，将使当前高企的基础设施投资更具可持续性，从而化解市场对AI资本开支回报的核心疑虑。

报告指出，目前运营商在满足当前及未来算力需求方面仍受供给约束，谷歌和Meta均已上调2026财年资本开支预期，亚马逊管理层在一季度财报后也重申了维持高资本开支的策略。高盛预计，随着利润拐点临近，投资者将越来越多地寻找回报可见性的证据。

在具体标的方面，高盛对亚马逊的核心逻辑在于AWS收入增速重新加速（一季度同比增长28%），并拥有3,640亿美元的收入积压订单；对谷歌的看法基于其云业务一季度同比增长63%、积压订单环比近乎翻倍至约4,600亿美元；对Meta的判断则基于其广告业务增速显著超越数字广告行业整体，以及AI算力在提升用户参与度和广告变现方面的持续贡献。

在软件领域，高盛认为更低的token成本使软件厂商更容易将代理嵌入现有产品而不显著影响毛利率，同时支持围绕成果、生产力或工作单元而非单纯席位数量进行定价，从而扩大软件可寻址市场。对于IT服务公司，随着代理将AI消费从独立工具转向企业级、高集成度的工作流改造，对集成、治理和托管编排的需求将大幅提升，Accenture被视为这一趋势的主要受益者。

~~~~~~~~~~~~~~~~~~~~~~~~

以上精彩内容来自追风交易台。

更详细的解读，包括实时解读、一线研究等内容，请加入【追风交易台▪年度会员】

风险提示及免责条款

市场有风险，投资需谨慎。本文不构成个人投资建议，也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资，责任自负。