加速一切!黄仁勋:Blackwell现在投产,2026年推出下一代AI平台Rubin,配HBM4

硬AI
英伟达将生成式AI的兴起视为一场新的工业革命,计划每年升级AI加速器,期望AI向个人电脑转向的过程中,英伟达可以发挥重要作用。黄仁勋强调英伟达的降本能力,发布基于其芯片的服务器计算机的新设计,甚至连英伟达的竞争对手AMD和英特尔也在利用MGX,英伟达公布了每年发布Spectrum-X的计划,英伟达的推理微服务NIM、AI助手G-Assist等也有亮相。黄仁勋还强调,AI的下一波浪潮是物理智能,也即真实世界AI。

本文作者:朱希

来源:硬AI

6月2日周日,英伟达CEO黄仁勋在COMPUTEX技术大会前夕发表重磅讲话。COMPUTEX台北国际电脑展即将在中国台湾举行。英伟达是人工智能浪潮的主要受益者,伴随着投资者的疯狂追捧,其已成为全球市值最高的芯片制造商,一举一动备受市场关注。

先来一个花絮:老黄逛台北夜市,受到明星般追捧,网友们感叹:这是科技CEO的时代啊!

黄仁勋周日洋洋洒洒讲了许多,如果用一句话来总结他最新的讲话,英伟达官网文章给出了最简洁有力的概括:加速一切。

黄仁勋最新表示,英伟达计划每年升级其AI加速器,并宣布将于2025年推出Blackwell Ultra芯片,以及计划在2026年推出一个名为Rubin的下一代平台。英伟达还推出了新的工具和软件模型。

英伟达将生成式人工智能AI的兴起视为一场新的工业革命。黄仁勋表示:

生成式人工智能正在重塑行业,为创新和增长带来新机遇。

今天,我们正处于计算领域重大转变的风口浪尖。人工智能和加速计算的交汇将重新定义未来。

计算的未来正在加速发展。凭借我们在人工智能和加速计算方面的创新,我们正在突破可能的界限,推动下一波技术进步。

他重申了一年前在同一场合提出的主题,指出那些没有AI能力的企业将被甩在后面。

对于黄仁勋所说的创新,网友们更直白:别人就没在创新。

黄仁勋在演讲中表示,期望AI这项技术向个人电脑转向的过程中,英伟达可以发挥重要作用。当前,英伟达希望扩大其客户群,不再局限于少数云计算巨头。此前英伟达的收入大部分来自这些云计算巨头。作为扩张客户群的一部分,黄仁勋预计更多的各行各业的公司、外加政府机构,将采用AI。

黄仁勋强调英伟达的降本能力

黄仁勋表示:“我们正在看到计算膨胀。”随着需要处理的数据量呈指数级增长,传统的计算方法无法跟上,只有通过英伟达的加速计算方式才能降低成本:

随着中央处理器(CPU)扩展速度放缓,最终基本停止,我们应该加快让每一个处理密集型应用程序都得到加速,每个数据中心也肯定会得到加速,加速计算是非常明智的,这是很普通的常识。

英伟达通过为CPU添加专用的辅助处理器,来实现了对于密集型应用程序的加速。

由于这两个处理器可以并行工作,它们都是自治的,具有更多独立的值,我们可以将100个单位的时间加速到1个单位的时间,速度快得令人难以置信。

黄仁勋强调英伟达的降本能力——英伟达正在降低将数据转化为智能的成本。“加速计算是可持续计算。”他阐释了GPU和CPU的组合如何实现最高可达100倍的加速,同时仅将功耗提高三倍,每瓦性能比单独使用CPU高出25倍。“买的越多,省的越多。”

黄仁勋声称,使用英伟达的技术可以节省98%的成本、减少97%的能耗,并称这是“CEO数学”,虽然不精确,但却是正确的。

英伟达降本能力太强大,粉丝反问,给我一个客户们突然不再想要这些芯片的理由:

 

Blackwell芯片现在投产

黄仁勋表示,英伟达的加速平台正在全面投产,无论是通过配备众多英伟达RTX功能的AI个人电脑和消费者设备,还是通过使用英伟达全套计算平台构建和部署AI工厂的企业。英伟达的Blackwell芯片现在投产。

对于Blackwell芯片,黄仁勋说,“即使是摩尔定律在其最佳时期,Blackwell所能实现的计算量与之相比,也是令人难以置信的。每当我们提高计算强度时,成本就会降低。我们所做的是,通过Blackwell卓越的计算能力,训练一个具有2万亿参数和8万亿tokens的GPT-4模型的能耗,能耗降低至1/350。”

对此,网友表示,英伟达没有强大的竞争对手,只能跟摩尔定律相互PK了,无敌是多么的寂寞:

 

一年的节奏

黄仁勋介绍了关于芯片产品年度升级周期的计划,表示英伟达打算每年都升级AI加速器/AI芯片。他重申此前提到的一年的节奏,“我们公司有一个一年的节奏。我们的基本理念非常简单:按照一年的节奏构建整个数据中心规模,将其分解并以零部件的形式销售给您,并将一切推向技术的极限。”

黄仁勋公布了包括Blackwell Ultra和后续芯片的计划:

2025年将推出Blackwell Ultra。

现在为2026年开发的下一代平台叫Rubin,Rubin平台是即将推出的Blackwell平台的下一代,这是其首次亮相。

即将推出的Rubin AI平台将使用HBM4,这是下一代高带宽内存。华尔街见闻网站注:高带宽内存至关重要,目前已成为AI加速器生产的瓶颈,其主要生产商SK海力士公司到2025年之前几乎已经售罄。

黄仁勋透露,Rubin平台将具备全新的GPU、一款新的基于Arm架构的CPU,以及配备NVLink 6、CX9 SuperNIC和X1600融合InfiniBand/以太网交换机等先进网络。黄仁勋没有提供更多关于即将推出的产品的详细规格。

 

行业携手英伟达,打造AI工厂

英伟达最初是通过销售台式电脑游戏卡起家的,这一背景在电脑制造商们推崇更多AI功能时派上了用场。微软公司及其硬件合作伙伴正在利用Computex大会展示带有AI增强功能的新款笔记本电脑,品牌名为Copilot+。这些即将上市的大多数设备都基于英伟达的竞争对手高通公司提供的一种新型处理器,这种处理器可使它们在一次充电后使用更长时间。

虽然这些设备可以应对简单的AI功能,但添加英伟达的显卡将大大提高它们的性能,并为像游戏这样的热门软件带来新功能。英伟达表示,像华硕电脑这样的PC制造商正在提供这种电脑。

英伟达联合全球范围内多家顶级电脑制造商发布了一个以英伟达Blackwell架构支撑的系统“列阵”,配置Grace CPUs、NVIDIA网络设备和基建,以支持企业打造AI工厂和数据中心,从而推动下一波生成式人工智能突破。

据黄仁勋介绍,华硕、技嘉、超微电脑、ASRock Rack、Ingrasys、Inventec、Pegatron、QCT、Wistron以及Wiwynn等公司,它们提供云计算、赋能以及边缘人工智能系统,这些产品将搭载英伟达的GPU和网络配件。黄仁勋直言:“下一次工业革命已经拉开了序幕。”

为了帮助软件开发商为PC带来更多新功能,英伟达还在提供工具和预训练的AI模型:它们将处理复杂的任务,比如决定是在机器本身上处理数据还是通过互联网将其发送到数据中心。

MGX平台新设计

英伟达还发布了基于其芯片的服务器计算机的新设计。英伟达的MGX模块化参考设计平台现在支持Blackwell,包括为大型语言模型推理、检索增强生成(RAG)和数据处理设计的GB200 NVL2平台。

任何服务器系统构建者都可以使用这些参考设计来节省开发时间,同时确保设计和性能的一致性。惠普和戴尔等公司正在使用英伟达的MGX平台,以便更快地将企业和政府机构使用的产品推向市场。

甚至连英伟达的竞争对手AMD和英特尔也在利用MGX,将他们的处理器与英伟达的芯片放在一起使用。AMD和英特尔也支持MGX平台,并计划首次推出他们自己的CPU主机处理器模块设计。

下一代网络Spectrum-X

英伟达早前宣布的产品,如用于网络的Spectrum X,现在已经普遍可用并被广泛采用。黄仁勋公布了每年发布Spectrum-X产品的计划,以满足人工智能对高性能以太网网络的需求。

英伟达的Spectrum-X是首款为人工智能AI构建的以太网结构,与传统以太网结构相比,其网络性能提高了1.6倍。它加速了AI工作负载的处理、分析和执行,进而加速了人工智能解决方案的开发和部署。Spectrum-X到2026年或可扩展到数百万GPU。

CoreWeave、GMO Internet Group、Lambda、Scaleway、STPX Global和Yotta是首批采用Spectrum-X的人工智能云服务提供商,旨在为其人工智能基础设施带来极致的网络性能。

分析称,英伟达的Spectrum产品线是其以太网方案的主力产品,特别受到公司高层的重视。据预测,Spectrum产品线可能在当年达到数十亿美元的收入规模。英伟达采取“先InfiniBand再以太网”的商业策略,GPU推出时优先推广利润较高的InfiniBand交换机,随后推广以太网产品。

 

英伟达的NIM和AI助理

英伟达的推理微服务(简称NIM,黄仁勋称其为“盒子里的人工智能”)也有进一步的亮相。这些微服务是一组中间软件和模型,可以帮助公司更快地推出AI服务,而无需担心底层技术。英伟达表示将免费提供NIM产品的访问权限,部署这些服务的公司随后需要向英伟达支付使用费。

借助英伟达的NIM,全球2800万开发者现在可以轻松创建生成式AI应用程序。

NIM还可以使企业能够最大化其基础设施投资。例如,在NIM中运行Meta Llama 3-8B,在加速基础设施上生成的AI tokens数量比不使用NIM时最高多3倍。英伟达的近200家技术合作伙伴,包括Cadence、Cloudera、Cohesity、DataStax、NetApp、Scale AI和Synopsys,正在将NIM集成到他们的平台中,以加速特定领域应用的生成式AI部署,如copilots、代码助手、数字人类化身等。

Hugging Face现在也开始提供NIM,首先推出的是Meta Llama 3。黄仁勋表示,“今天我们刚刚在Hugging Face上发布了完全优化的Llama 3,你可以在那里试用。你甚至可以将它带走。所以你可以在云端运行,在任何云端运行,下载它,放到你自己的数据中心,并可以为你的客户提供服务。”

 

英伟达的RTX AI个人电脑,由RTX技术驱动,计划通过超过200款RTX AI笔记本电脑和500多款AI驱动的应用和游戏,来彻底改变消费者的体验。

英伟达为数字人推出G-Assist和ACE数字人技术NIM软件:

  • 英伟达宣布了一个名为Project G-Assist的RTX驱动的AI助手技术演示,展示了针对PC游戏和应用的情境感知辅助。
  • RTX AI工具包和新推出的基于PC的NIM推理微服务用于英伟达ACE数字人平台,凸显了英伟达对AI可访问性的承诺。

英伟达还为微软Windows Copilot Runtime推出用于RTX加速API的小语言模型(SLM)。微软和英伟达正在合作,帮助开发者通过简单的API访问,将新的生成式AI功能引入他们的Windows本地(也即直接在Windows系统上运行的应用程序)和网络应用。这些功能包括RTX加速的SLM,使设备上运行的RAG功能成为Windows Copilot Runtime的一部分。

对于上述各款应用,网友总结说,AI软件工厂NIM与CUDA进一步绑定,推出更多数字人案例。通过CUDA将事先训练好的AI模型打包、优化好。与ACE、SLM技术协同,打造逼真的数字人,并推出系列标杆案例,如游戏、护士、客服、导师等。

 

英伟达机器人技术

英伟达正引领50万亿美元级别的工业数字化转型,各行业纷纷拥抱自主运营和数字孪生技术——这些虚拟模型提升了效率并降低了成本。通过其开发者计划,英伟达提供了访问NIM的途径,促进AI创新。

黄仁勋强调了机器人和AI在未来发展中的重要性:

AI的下一波浪潮是Physical AI物理智能、也即真实世界AI。理解物理定律的AI,可以在我们身边工作的AI。

与具身智能相比,Physical AI要求更强的仿真能力,在虚拟世界完成机器人的强化训练学习。

机器人技术已经来了。实体AI已经来了。这不是科幻小说。这真的非常非常令人兴奋。

所有的工厂都会变成机器人化的工厂。这些工厂将协调机器人,而机器人将制造出具有机器人功能的产品。

黄仁勋推广数字孪生技术,该技术可以在英伟达称为Omniverse的虚拟世界中使用:

为了展示其潜力,黄仁勋展示了一个名为Earth 2的地球数字孪生,以及它如何帮助进行更复杂的天气模式建模和其他复杂任务。

黄仁勋指出,像富士康这样的制造商正在使用这些工具来更高效地进行计划和操作工厂。他展示了富士康如何使用英伟达的Omniverse、Isaac和Metropolis创建数字孪生,结合视觉AI和机器人开发工具来增强机器人设施。

英伟达Isaac平台为开发者提供了一个强大的工具包,用于构建AI机器人,包括自主移动机器人(AMRs)、工业机械臂和类人机器人,这些机器人由AI模型和Jetson Orin、Thor等超级计算机提供支持。黄仁勋还强调了Isaac在提升工厂和仓库效率方面的作用,全球巨头如比亚迪电子、西门子、泰瑞达机器人和Intrinsic都在采用其先进的库和AI模型。

英伟达的IGX平台专为边缘计算而设计,可以在本地处理数据,而无需依赖集中式的云服务器。该平台旨在满足严格的监管和安全标准,这在医疗行业尤为重要,因为涉及到患者的安全和数据的保护。IGX平台适用于需要高度可靠性和实时处理的场景,包括医学技术中的诊断成像、机器人手术和患者监护,以及工业应用中的自动化机器人和智能制造系统。像ADLINK、Advantech、ONYX等公司与英伟达合作,基于IGX平台开发并提供解决方案。

网友评论说:黄仁勋揭晓了他的机器人大军,无需惊慌(暂时的)!

 

最后

整场演讲下来,也有网友觉得老黄并没有说什么新东西,但是,他就是用同样的圣经布道,用很多生成式AI的影片、音乐、和语音。最后用情感连结门徒(X)合作伙伴们,呼吁大家一起迈向AI未来的光明坦途。

本文来自微信公众号“硬AI”,关注更多AI前沿资讯请移步这里

风险提示及免责条款
市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。