赛道Hyper | 谁能阻挡AI GPU霸主英伟达的脚步

2023/06/01 20:55

天下英雄谁敌手？

尽管英伟达仅在5月30日盘中突破万亿美元市值，短暂进入高光时刻便再次跌回万亿美元以下市值，但由ChatGPT引发的“英伟达”旋风，在AI业界却越刮越猛。

6月1日，多个独立信源告诉华尔街见闻，英伟达CEO黄仁勋将于6月5日至6月11日期间抵达中国大陆。但英伟达没有向华尔街见闻正面确认此则消息。

眼下，A股但凡和“英伟达”或“黄仁勋”三字沾边，个股都受到市场热捧。5月29日，黄仁勋在参加COMPUTEX 2023中国台北国际电脑展会时，演示英伟达新平台Isaac AMR（自主移动机器人）。这个平台的底盘采用了科创板公司的RMP系列产品，该公司盘中立即涨停。

在“超级AI应用”ChatGPT的指引下，英伟达第二季度营收预测值超出市场预期竟高达惊人的50%，至110亿美元。

谁还能阻挡英伟达称霸AI赛道？

英伟达的AI GPU强在何处？

英特尔已不再是当年那家占据统治地位的科技公司。

原本CPU是PC或服务器最重要的核心部件。但是现在，加速计算芯片通过杀手级应用ChatGPT正在加速取代CPU的地位。算力成为以IDC为基础条件的AI应用发展核心驱动力，GPU成为关键部件。

“生成式人工智能将是（英伟达业绩）引爆点。”黄仁勋说，“与CPU相比，未来IDC更需要GPU，因为数据都将通过生成式LLM自动生成，而非主要用于数据检索。”生成数据需要更多的GPU，而检索数据，只需要CPU。

目前，性能愈发强悍的PC系统配置了超过8个服务器GPU和1个CPU的算力硬件，英伟达占据了全球超过八成（84%）的服务器（IDC：数据中心）GPU市场份额。

比如，英伟达DGX系统，这是用于数据训练的IDC核心算力来源，搭载了8颗英伟达高端H100 GPU，还有两颗CPU；谷歌的A3超级计算机，同样用了8颗英伟达H100 GPU，但只用了1颗英特尔制造的高端至强处理器。

据英伟达公示的技术资料显示，H100于2022年三季度发布，训练速度比A100快9倍，推理速度比上代产品A100快30倍。5月29日，黄仁勋发布了GH200超级芯片，这是英伟达开发的基于Arm架构的CPU+GPU集成方案，用于开发聊天机器人、互联网推荐系统算法等大模型AI应用。

这个趋势随着AGI在产业的持续落地，产生的影响日益显著。英伟达IDC业务在第一季度增长了14%，但英特尔的AI和IDC业务部门业绩下降了39%。

另一项因素也在加强英伟达超越英特尔的优势。英伟达服务器GPU售价极高，单颗英伟达H100售价高达4万美元（eBay平台加急售价），而英特尔最新一代至强CPU的单颗标价虽然也很高，但“只有”1.7万美元。

当然英伟达也不是全无对手，当年英特尔的上游合作伙伴AMD，也在发力服务器GPU，包括高通、苹果、谷歌和亚马逊在内的众多巨头，都在设计开发移动AI算力芯片，而非服务器GPU；甚至是英特尔，在游戏领域的GPU技术实力，同样不容小觑。

但是在眼下，英伟达确实一家独大。但凡提及AGI算力，无不将英伟达服务器GPU列为首选。这主要是因为AGI目前对算力极为渴求，要处理处理TB级数据，训练性能要求极高，而在需要“推理”的过程中使用模型生成文本、图像或预测，也不是移动AI GPU能达成的。

更重要的还不在于英伟达的GPU硬件性能，而是——英伟达的AI软件系统：英伟达的AI专有软件，能轻松聚合GPU的硬件功能用于AI应用程序。

黄仁勋在英伟达财报电话会议上也说，“我们的软件不易复制，（竞对）必须设计所有的软件、库和算法，将它们集成到框架中并做持续优化；同时，软件架构也同样需要优化迭代。”

也就是说，要做到和英伟达一样，实现GPU与AI应用的无缝衔接，要做的不仅仅是优化芯片的设计和性能，还需要对软硬件的技术架构和整体框架做同步优化，这是一项系统工程。要超越单品性能虽然不易，但并非全无可能，但面对系统级能力，谈超越，难度不言而喻。

英伟达也在持续增加对IDC的资本投入。据英伟达最新财报显示，其整体收入中，IDC资本支出的份额占比已增至8.4%，而之前根据其上一年的固定比率预测为6.5%。

初创公司和巨头的现实威胁

看上去似乎无人能阻挡英伟达在AI技术领域的统治地位，但AI前景的无限空间，仍在吸引无数挑战者。

除了上文提及的多家巨头，初创AI公司成为英伟达AI挑战者大军不容忽视的一部分。当然，这种技术要求的初创公司很难出自无名之辈。

有一则极具戏剧性的传闻，出自在前沿技术和应用领域极为活跃的特斯拉公司首席执行官埃隆·马斯克（Elon Musk）之口。这位持续让世人惊叹的科技巨子说，“就连狗都在抢GPU”。

有鉴于此，所以马斯克虽然在口头上叫停研究AI技术，但他的身体却很诚实：这位老兄在今年3月9日建立了一家取名为“X.AI”的AI公司，还偷偷摸摸买了10000颗英伟达GPU。

想分英伟达一杯羹的还有来自英特尔公司架构、图形和软件（IAGS）部门的副总裁、首席架构师Raja Koduri，这位技术大拿已于今年3月底离职。接下来，Raja Koduri将创办一家AI技术公司，主要研发新一代生成式AI工具，目的是削弱英伟达对数字电影和视频游戏市场的控制力。

与马斯克的X.AI公司不知道要干嘛相比，Raja Koduri的计划更清晰。他这家尚未命名的AI初创公司，第一个项目，是要创建一套AI工具，以便让包括电影和游戏艺术家在内的消费群体，无论用PC、Mac、iPad还是其他设备，都无需深入研究软件代码而直接生成自己想要的工作结果。

尽管这些AI赛道新手看上去很想大干一场，但真正对英伟达有现实挑战能力的还是AMD、微软和谷歌此类巨头。其中，AMD在游戏领域的GPU对英伟达有些许威胁，但IDC需要的服务器专用GPU性能无法望其项背。

至于微软、谷歌甚至云服务商比如亚马逊，都一面和英伟达保持良好的业务合作，一面又在下大本钱研发自己的AI专用GPU。

比如微软，这个桌面PC时代的超级霸主，正是OpenAI的背后金主（2019年微软给OpenAI投了10亿美元），同时也是英伟达H100芯片最大的采购方。今年3月，微软用数万颗英伟达GPU帮OpenAI组装了一台AI超级计算机。

但微软也在推进自己的AI芯片研发计划，代号“雅典娜”。这项计划始于2019年，目标是为训练LLM（大语言模型）等软件而设计，同时可支持推理，能为ChatGPT背后的所有AI软件提供算力支持，初代雅典娜GPU量产时间表被定于2024年。

与微软相比，谷歌对英伟达的威胁可能更显著。目前谷歌的AI处理芯片是专为AI研究开发机器学习（Machine Learning）的专属芯片TPU（张量处理单元），能同时处理“云上”训练和推理，并设计了基准测试工具MLPerf。

谷歌TPU如今已迭代到V4版。据谷歌4月6日披露，得益于互连技术和领域特定加速器（DSA）方面的关键创新，谷歌云TPU v4在扩展机器学习系统性能方面比其前代版本有了近10倍的飞跃。

TPU v4是谷歌于2021年推出的、专门用于执行机器学习的AI芯片，是谷歌第5代特殊领域加速器（DSA：Domain Specific Accelerator）及第3代用于ML模型的超级计算机平台，其性能与英伟达A100相比，速度快1.2-1.7倍，功耗低1.3-1.9倍。

尽管如此，就眼下看，对英伟达具有商业层面现实威胁的公司，还不存在。这些威胁，现在还处于水面之下。

风险提示及免责条款

市场有风险，投资需谨慎。本文不构成个人投资建议，也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资，责任自负。