谷歌推出迄今最强大的定制AI芯片,试图通过提供差异化的硅片解决方案从人工智能公司手中争夺业务,直接挑战英伟达在AI芯片市场的主导地位。
11月6日,据媒体报道,谷歌宣布将在未来几周内推出第七代张量处理单元Ironwood。该公司表示,这款芯片"专为最苛刻的工作负载量身打造",在训练和推理方面的性能较第六代Trillium TPU提升了四倍。单个超级计算机单元可通过芯片间互联网络连接多达9216颗Ironwood TPU,并访问1.77 PB的共享高带宽内存。
AI初创公司Anthropic已成为首批重要客户。谷歌上月宣布将允许Anthropic使用多达100万单位的定制芯片来训练和运行其Claude大语言模型。Anthropic对Ironwood的早期反馈"非常积极",预计在训练到运行Claude模型的过程中将看到令人印象深刻的性价比提升。
这一举措凸显谷歌在与微软、亚马逊和Meta的AI基础设施竞赛中的战略布局。尽管大多数大型语言模型依赖英伟达的图形处理单元,但谷歌的TPU作为定制芯片可在价格、性能和效率方面提供差异化优势。
性能跃升四倍,架构应对数据密集型需求
Ironwood采用了先进的互联架构以应对数据密集型AI模型的需求。这款完全由谷歌内部研发的芯片设计用于处理从大规模AI模型训练、强化学习到低延迟大批量AI推理的各类任务。
谷歌表示,单个POD(谷歌的AI超级计算机单元)可连接多达9216颗Ironwood TPU,从而避免大型数据密集型AI模型的数据瓶颈,让客户能够"运行和扩展现存最大、最数据密集型的模型"。这种连接不仅有助于芯片间通信,还允许所有芯片访问1.77 PB的共享高带宽内存,这对大规模推理至关重要。
谷歌的光电路交换技术可帮助在服务中断时进行路由。该公司在其搜索和YouTube算法中使用TPU,并为其Gemini AI模型提供动力。
分析师看好TPU业务价值,称已成最佳替代品
分析师认为,谷歌的TPU业务价值可能被严重低估。D.A. Davidson的Gil Luria去年9月表示,谷歌TPU已缩小与英伟达的差距,成为"最佳替代品"。他认为,如果将TPU业务与谷歌DeepMind AI研究实验室合并,价值可能高达9000亿美元。
Melius Research分析师Ben Reitzes在上月底的报告中对谷歌TPU表达了类似的积极看法,称其为"目前最成熟的专用集成电路"。专用集成电路是为处理特定AI任务而定制的芯片。
Reitzes表示,谷歌"能够使用其TPU快速创新Gemini"。他指出,早期开发这一产品的决策现在开始向上拐点,为博通的AI收入和谷歌云增长做出贡献。
TPU的研发已持续十年。与英伟达的GPU不同,TPU属于定制芯片类别,专门针对AI工作负载优化,可在价格、性能和效率方面提供优势。
推出Arm架构处理器,完善产品组合
谷歌还预览了基于Arm架构的定制设计Axion中央处理器的新实例。该公司称,其新推出的N4A虚拟机是迄今为止最具成本效益的产品。这些通用虚拟机旨在运行网络服务器和数据库等常见工作负载。
谷歌表示,其首款基于Arm的裸机实例C4A将很快提供预览,该实例专门用于支持开发Android操作系统和汽车系统等工作负载。
谷歌表示:"要在模型架构、软件和技术不断变化的时代中蓬勃发展,你需要将用于模型训练和服务的专用AI加速器,与用于日常工作负载(包括支持这些AI应用的工作负载)的高效通用CPU相结合。"
报道指出,这一系列升级旨在使其云服务更便宜、更快速、更灵活,以与规模更大的云服务商亚马逊AWS和微软Azure竞争。在微软、亚马逊、Meta等科技巨头均大举投入AI基础设施建设的背景下,谷歌的定制芯片策略为其在这场竞赛中提供了差异化优势。



