谷歌一口气推出两款TPU，首度拆分训练与推理芯片，企业AI智能体全面铺开

04/22 20:57

谷歌云发布两款第八代TPU芯片：8T主攻训练、8I面向推理场景，核心指向降低推理成本与支撑AI智能体规模化，预计于今年晚些时候上市供应；并推出Gemini企业级智能体平台，补齐记忆与协作短板，切入自动化入口。在推理需求爆发背景下，谷歌正以算力重构+应用层卡位，正面冲击英伟达与OpenAI主导格局。

Alphabet旗下谷歌云在年度开发者大会上密集出牌，同步推出新一代自研芯片与企业级AI智能体工具，在硬件和软件两条战线上同时向英伟达、OpenAI及Anthropic发起挑战。

当地时间周三，谷歌云在拉斯维加斯举行的Google Cloud Next 2026大会上，发布了第八代张量处理器（TPU）的两款新品：专为AI模型训练设计的TPU 8T，以及专为推理（inference）阶段优化的TPU 8i，预计于今年晚些时候上市供应。这是谷歌首次将训练与推理任务拆分至独立芯片，标志着其AI硬件战略的重大转向。

与此同时，谷歌还推出了Gemini Enterprise Agent Platform等一系列AI智能体开发工具，直接瞄准企业自动化市场。

新芯片的发布正值AI推理需求急速扩张之际。谷歌云计算与AI基础设施副总裁Mark Lohmeyer表示："关键在于如何以最低的每笔交易成本实现最低的响应延迟。交易量正在大幅攀升，而每笔交易的成本必须大幅下降，才能实现规模化。"两款新芯片将于今年晚些时候正式上线。

训练与推理分离，芯片性能大幅跃升

谷歌此次将第八代TPU拆分为两款独立产品，是对AI工作负载日益分化趋势的直接回应。

谷歌高级副总裁兼AI与基础设施首席技术官Amin Vahdat在博客中写道："随着AI智能体的兴起，我们判断业界将受益于针对训练和推理各自需求专门优化的芯片。"

TPU 8t专为AI模型训练优化，号称能够"将前沿模型开发周期从数月压缩至数周"。

在性能层面，TPU 8t的每瓦性能较上一代提升124%，TPU 8i则提升117%。与去年11月发布的第七代Ironwood TPU相比，TPU 8t在同等价格下性能提升2.8倍，TPU 8i的性能则提升80%。

训练芯片TPU 8t最多可将9600块芯片组合成一套系统，谷歌表示，在部署如此大规模系统时，电力已成为数据中心的核心制约因素，更高的能效比因此至关重要。

TPU 8i则主要面向推理场景，适用于运行AI模型及处理AI智能体任务。其架构设计重点在于大容量片上存储。每块芯片集成384MB的静态随机存取存储器（SRAM），是上一代Ironwood的三倍。

两款芯片均计划于2026年晚些时候正式对外供应。

Alphabet首席执行官桑达尔·皮查伊在博客中表示，这一架构旨在"以具有成本效益的方式，提供同时运行数百万个智能体所需的大规模吞吐量和低延迟"。片上存储的增加意味着芯片无需频繁从外部调取数据，对于需要多步骤推理的AI任务尤为关键。

AI智能体平台全面铺开，直指OpenAI与Anthropic

在软件层面，谷歌此次发布了一套完整的企业AI智能体工具链，正面迎战OpenAI和Anthropic在企业市场的布局。

据彭博报道，多位初创公司创始人表示，硅谷工程师在AI编程工具的选择上通常在Anthropic的Claude Code与OpenAI的Codex之间切换，谷歌往往不在考虑之列——这一现状令谷歌高层深感忧虑。

谷歌云CEO Thomas Kurian在博客中表示："这不是提供可拼凑在一起的单项服务，而是提供一个全面的创新基础骨架。"

新推出的Gemini Enterprise Agent Platform新增了Memory Bank和Memory Profile功能，帮助智能体记住与用户的历史交互，弥补早期AI工具的记忆短板；Agent Simulation功能则允许开发者在上线前对工具进行更充分的测试。

谷歌还推出了协作平台Projects，整合来自Workspace、微软OneDrive及企业内部聊天工具的信息，为智能体提供必要的上下文支持。此外，谷歌还发布了面向普通员工的Gemini Enterprise应用，定位为"每位员工的AI前台"，用户无需编写任何代码即可创建智能体。

TPU采用加速，英伟达合作并行推进

尽管谷歌在自研芯片上持续加码，但其与英伟达的合作关系并未中断。

Mark Lohmeyer表示，谷歌计划成为今年下半年英伟达新一代芯片设计的首批部署方之一，同时将继续为希望使用英伟达系统的客户提供相关服务。

与此同时，谷歌TPU的商业采用正在提速。

对冲基金Citadel Securities已基于谷歌TPU构建量化研究软件，美国能源部旗下全部17个国家实验室均在使用基于TPU构建的AI协作科学家软件。Meta已与谷歌签署一项多年期、数十亿美元的TPU使用协议，AI新贵Anthropic也已承诺使用数吉瓦级别的谷歌TPU算力。

DA Davidson分析师去年9月估计，TPU业务与谷歌DeepMind AI部门合计价值约9000亿美元。

值得注意的是，谷歌并未将新芯片的性能与英伟达产品直接对比。英伟达方面，其即将推出的新品线将整合其以200亿美元收购Groq所获得的技术，专门针对超低延迟推理场景。

英伟达首席执行官黄仁勋此前表示，超过20%的AI工作负载可能最适合由此类芯片处理。Groq由一批前谷歌工程师于2016年创立。

为进一步扩大TPU的可及性，谷歌还在测试将TPU部署至客户自有数据中心的方案，并推进与第三方软件工具的兼容性。不过，芯片供应瓶颈以及AI模型快速迭代与多年期芯片开发周期之间的错位，仍是谷歌扩大规模过程中需要应对的主要不确定因素。

风险提示及免责条款

市场有风险，投资需谨慎。本文不构成个人投资建议，也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资，责任自负。

谷歌一口气推出两款TPU，首度拆分训练与推理芯片，企业AI智能体全面铺开

训练与推理分离，芯片性能大幅跃升

AI智能体平台全面铺开，直指OpenAI与Anthropic

TPU采用加速，英伟达合作并行推进

谷歌财报的四个焦点：云利润率、资本开支增长逻辑、TPU会计处理、SpaceX的算力租约

报道：谷歌正在开发新款芯片，Gemini架构直接写入硅片，效率最高提升10倍

谷歌杀入英伟达"地盘"：TPU扩张战略直指新云服务商

报道：联发科ASIC拿下谷歌以外“第二大客户”，预计为Meta

SemiAnalysis：谷歌下一代TPU将采用英特尔EMIB-T封装