告别单一芯片依赖！OpenAI拟开放跨平台AI优化工具，剑指英伟达CUDA

06/02 12:17

据报道，OpenAI负责计算与基础设施的高级副总裁Sachin Katti表示，正在开发一套软件抽象层，使研究人员和产品团队在运行AI工作负载时无需关心底层硬件来自哪家供应商，允许AI工作负载在不同供应商芯片上无缝运行。OpenAI已与亚马逊、AMD、Cerebras合作并自研芯片，加速去英伟达化。

OpenAI正考虑将其内部开发的跨芯片软件优化工具对外公开，此举若落地，将直接冲击英伟达长期以来凭借CUDA软件生态构筑的护城河。

6月1日，据科技媒体The Information报道，OpenAI负责计算与基础设施的高级副总裁Sachin Katti在一场公开讨论中表示，该公司正在开发一套软件抽象层，使研究人员和产品团队在运行AI工作负载时无需关心底层硬件来自哪家供应商。

当被问及是否会将这一能力对外开放时，Katti明确表示"这在考虑范围之内"，并将其描述为"智能体优化能力（agentic optimization capability）"，称"我们希望将这一能力提供给全世界"。

分析称，这一表态意义重大。英伟达的市场主导地位长期以来有赖于CUDA——这套专有的编译器、函数库与优化工具体系，是主流AI开发者在英伟达芯片上运行软件的核心依赖。一旦OpenAI的跨平台工具公开发布，将进一步削弱CUDA的差异化优势，加速AI算力市场的多元化竞争格局。

多芯片战略提速，OpenAI加速摆脱英伟达依赖

据报道，Katti在讨论中直言，AI行业将走向"高度异构化"，各家公司将同时使用来自多家供应商的AI芯片。这一判断背后，是OpenAI自身战略的深刻转变。

OpenAI此前几乎完全依赖英伟达芯片，但近期已相继与亚马逊、Cerebras及AMD签署协议，引入其AI芯片资源，同时还在自研定制AI芯片。

Katti在讨论中未透露OpenAI是否会像Anthropic和Meta那样采用谷歌的定制芯片。

这一趋势并非OpenAI独有。Anthropic和Meta同样不愿在如此核心的业务环节上依赖单一供应商，且没有任何一家供应商能够单独满足其庞大的算力需求。

软件抽象层：谷歌Borg模式的AI版本

报道称，Katti将OpenAI正在构建的软件体系类比于谷歌著名的Borg计算管理系统——后者正是谷歌得以跨异构硬件大规模扩展产品的关键基础设施。"这就是我们在AI领域正在走的路，"他说。

更具颠覆性的是，Katti暗示AI本身将成为打破CUDA垄断的工具。"我们预计将利用AI生成优化内核（optimized kernels），从而真正支持所有这些不同的芯片选项，"他表示。

Amp创始人Anjney Midha在同一讨论中指出，如果OpenAI这类开发者将此类内部工具公开发布，使AI能够高效运行于英伟达、谷歌、AMD等多家芯片之上，将对英伟达构成实质性冲击。

事实上，CUDA的护城河已在悄然收窄。Meta开发的PyTorch框架早已让开发者能够更便捷地为多种芯片编写AI代码，部分初创公司也在销售AI工具，将PyTorch代码转译为可直接在芯片上运行的底层代码。

Vera Rubin芯片部署在即，算力瓶颈转向电力与工程

除软件战略外，Katti还披露了OpenAI在英伟达下一代Vera Rubin芯片系统上的部署进展。他表示，OpenAI已获得该芯片的早期样品，预计将于今年年底将其投入AI训练使用。

Katti对英伟达在Blackwell系统推出过程中暴露的问题给予了正面评价，认为英伟达已从中汲取经验。Blackwell初代系统在规模化部署时曾因网络、固件和布线复杂性令多家云服务商头疼，但新版系统已大幅改善。"英伟达确实从诸多成长阵痛中学到了东西，"他说。

Katti未透露哪家云服务商将率先承载OpenAI的Vera Rubin集群，仅表示各方之间存在"良性竞争"。OpenAI目前的主要云服务商包括微软、甲骨文和亚马逊。

值得关注的是，Katti将当前算力扩张的最大瓶颈指向了电力供应与工程能力，而非芯片本身。

"目前制约我们的更多是电力和工程能力，而非其他，"他说。这一判断对AI基础设施投资者的资源配置方向具有直接参考价值。

风险提示及免责条款

市场有风险，投资需谨慎。本文不构成个人投资建议，也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资，责任自负。