告别单一芯片依赖!OpenAI拟开放跨平台AI优化工具,剑指英伟达CUDA

据报道,OpenAI负责计算与基础设施的高级副总裁Sachin Katti表示,正在开发一套软件抽象层,使研究人员和产品团队在运行AI工作负载时无需关心底层硬件来自哪家供应商,允许AI工作负载在不同供应商芯片上无缝运行。OpenAI已与亚马逊、AMD、Cerebras合作并自研芯片,加速去英伟达化。

OpenAI正考虑将其内部开发的跨芯片软件优化工具对外公开,此举若落地,将直接冲击英伟达长期以来凭借CUDA软件生态构筑的护城河。

6月1日,据科技媒体The Information报道,OpenAI负责计算与基础设施的高级副总裁Sachin Katti在一场公开讨论中表示,该公司正在开发一套软件抽象层,使研究人员和产品团队在运行AI工作负载时无需关心底层硬件来自哪家供应商。

当被问及是否会将这一能力对外开放时,Katti明确表示"这在考虑范围之内",并将其描述为"智能体优化能力(agentic optimization capability)",称"我们希望将这一能力提供给全世界"。

分析称,这一表态意义重大。英伟达的市场主导地位长期以来有赖于CUDA——这套专有的编译器、函数库与优化工具体系,是主流AI开发者在英伟达芯片上运行软件的核心依赖。一旦OpenAI的跨平台工具公开发布,将进一步削弱CUDA的差异化优势,加速AI算力市场的多元化竞争格局。

多芯片战略提速,OpenAI加速摆脱英伟达依赖

据报道,Katti在讨论中直言,AI行业将走向"高度异构化",各家公司将同时使用来自多家供应商的AI芯片。这一判断背后,是OpenAI自身战略的深刻转变。

OpenAI此前几乎完全依赖英伟达芯片,但近期已相继与亚马逊、Cerebras及AMD签署协议,引入其AI芯片资源,同时还在自研定制AI芯片。

Katti在讨论中未透露OpenAI是否会像Anthropic和Meta那样采用谷歌的定制芯片。

这一趋势并非OpenAI独有。Anthropic和Meta同样不愿在如此核心的业务环节上依赖单一供应商,且没有任何一家供应商能够单独满足其庞大的算力需求。

软件抽象层:谷歌Borg模式的AI版本

报道称,Katti将OpenAI正在构建的软件体系类比于谷歌著名的Borg计算管理系统——后者正是谷歌得以跨异构硬件大规模扩展产品的关键基础设施。"这就是我们在AI领域正在走的路,"他说。

更具颠覆性的是,Katti暗示AI本身将成为打破CUDA垄断的工具。"我们预计将利用AI生成优化内核(optimized kernels),从而真正支持所有这些不同的芯片选项,"他表示。

Amp创始人Anjney Midha在同一讨论中指出,如果OpenAI这类开发者将此类内部工具公开发布,使AI能够高效运行于英伟达、谷歌、AMD等多家芯片之上,将对英伟达构成实质性冲击。

事实上,CUDA的护城河已在悄然收窄。Meta开发的PyTorch框架早已让开发者能够更便捷地为多种芯片编写AI代码,部分初创公司也在销售AI工具,将PyTorch代码转译为可直接在芯片上运行的底层代码。

Vera Rubin芯片部署在即,算力瓶颈转向电力与工程

除软件战略外,Katti还披露了OpenAI在英伟达下一代Vera Rubin芯片系统上的部署进展。他表示,OpenAI已获得该芯片的早期样品,预计将于今年年底将其投入AI训练使用。

Katti对英伟达在Blackwell系统推出过程中暴露的问题给予了正面评价,认为英伟达已从中汲取经验。Blackwell初代系统在规模化部署时曾因网络、固件和布线复杂性令多家云服务商头疼,但新版系统已大幅改善。"英伟达确实从诸多成长阵痛中学到了东西,"他说。

Katti未透露哪家云服务商将率先承载OpenAI的Vera Rubin集群,仅表示各方之间存在"良性竞争"。OpenAI目前的主要云服务商包括微软、甲骨文和亚马逊。

值得关注的是,Katti将当前算力扩张的最大瓶颈指向了电力供应与工程能力,而非芯片本身。

"目前制约我们的更多是电力和工程能力,而非其他,"他说。这一判断对AI基础设施投资者的资源配置方向具有直接参考价值。

风险提示及免责条款
市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。
相关文章