Alphabet旗下谷歌云在年度开发者大会上密集出牌,同步推出新一代自研芯片与企业级AI智能体工具,在硬件和软件两条战线上同时向英伟达、OpenAI及Anthropic发起挑战。
当地时间周三,谷歌云在拉斯维加斯举行的Google Cloud Next 2026大会上,发布了第八代张量处理器(TPU)的两款新品:专为AI模型训练设计的TPU 8T,以及专为推理(inference)阶段优化的TPU 8i,预计于今年晚些时候上市供应。这是谷歌首次将训练与推理任务拆分至独立芯片,标志着其AI硬件战略的重大转向。

与此同时,谷歌还推出了Gemini Enterprise Agent Platform等一系列AI智能体开发工具,直接瞄准企业自动化市场。
新芯片的发布正值AI推理需求急速扩张之际。谷歌云计算与AI基础设施副总裁Mark Lohmeyer表示:"关键在于如何以最低的每笔交易成本实现最低的响应延迟。交易量正在大幅攀升,而每笔交易的成本必须大幅下降,才能实现规模化。"两款新芯片将于今年晚些时候正式上线。
训练与推理分离,芯片性能大幅跃升
谷歌此次将第八代TPU拆分为两款独立产品,是对AI工作负载日益分化趋势的直接回应。
谷歌高级副总裁兼AI与基础设施首席技术官Amin Vahdat在博客中写道:"随着AI智能体的兴起,我们判断业界将受益于针对训练和推理各自需求专门优化的芯片。"
TPU 8t专为AI模型训练优化,号称能够"将前沿模型开发周期从数月压缩至数周"。
在性能层面,TPU 8t的每瓦性能较上一代提升124%,TPU 8i则提升117%。与去年11月发布的第七代Ironwood TPU相比,TPU 8t在同等价格下性能提升2.8倍,TPU 8i的性能则提升80%。
训练芯片TPU 8t最多可将9600块芯片组合成一套系统,谷歌表示,在部署如此大规模系统时,电力已成为数据中心的核心制约因素,更高的能效比因此至关重要。
TPU 8i则主要面向推理场景,适用于运行AI模型及处理AI智能体任务。其架构设计重点在于大容量片上存储。每块芯片集成384MB的静态随机存取存储器(SRAM),是上一代Ironwood的三倍。
两款芯片均计划于2026年晚些时候正式对外供应。
Alphabet首席执行官桑达尔·皮查伊在博客中表示,这一架构旨在"以具有成本效益的方式,提供同时运行数百万个智能体所需的大规模吞吐量和低延迟"。片上存储的增加意味着芯片无需频繁从外部调取数据,对于需要多步骤推理的AI任务尤为关键。
AI智能体平台全面铺开,直指OpenAI与Anthropic
在软件层面,谷歌此次发布了一套完整的企业AI智能体工具链,正面迎战OpenAI和Anthropic在企业市场的布局。
据彭博报道,多位初创公司创始人表示,硅谷工程师在AI编程工具的选择上通常在Anthropic的Claude Code与OpenAI的Codex之间切换,谷歌往往不在考虑之列——这一现状令谷歌高层深感忧虑。
谷歌云CEO Thomas Kurian在博客中表示:"这不是提供可拼凑在一起的单项服务,而是提供一个全面的创新基础骨架。"
新推出的Gemini Enterprise Agent Platform新增了Memory Bank和Memory Profile功能,帮助智能体记住与用户的历史交互,弥补早期AI工具的记忆短板;Agent Simulation功能则允许开发者在上线前对工具进行更充分的测试。
谷歌还推出了协作平台Projects,整合来自Workspace、微软OneDrive及企业内部聊天工具的信息,为智能体提供必要的上下文支持。此外,谷歌还发布了面向普通员工的Gemini Enterprise应用,定位为"每位员工的AI前台",用户无需编写任何代码即可创建智能体。
TPU采用加速,英伟达合作并行推进
尽管谷歌在自研芯片上持续加码,但其与英伟达的合作关系并未中断。
Mark Lohmeyer表示,谷歌计划成为今年下半年英伟达新一代芯片设计的首批部署方之一,同时将继续为希望使用英伟达系统的客户提供相关服务。
与此同时,谷歌TPU的商业采用正在提速。
对冲基金Citadel Securities已基于谷歌TPU构建量化研究软件,美国能源部旗下全部17个国家实验室均在使用基于TPU构建的AI协作科学家软件。Meta已与谷歌签署一项多年期、数十亿美元的TPU使用协议,AI新贵Anthropic也已承诺使用数吉瓦级别的谷歌TPU算力。
DA Davidson分析师去年9月估计,TPU业务与谷歌DeepMind AI部门合计价值约9000亿美元。
值得注意的是,谷歌并未将新芯片的性能与英伟达产品直接对比。英伟达方面,其即将推出的新品线将整合其以200亿美元收购Groq所获得的技术,专门针对超低延迟推理场景。
英伟达首席执行官黄仁勋此前表示,超过20%的AI工作负载可能最适合由此类芯片处理。Groq由一批前谷歌工程师于2016年创立。
为进一步扩大TPU的可及性,谷歌还在测试将TPU部署至客户自有数据中心的方案,并推进与第三方软件工具的兼容性。不过,芯片供应瓶颈以及AI模型快速迭代与多年期芯片开发周期之间的错位,仍是谷歌扩大规模过程中需要应对的主要不确定因素。




