英伟达GTC :Vera Rubin全面量产,杀入PC芯片市场,携宇树布局机器人

朱雪莹、叶桢、张雅琦
黄仁勋表示,英伟达将推出面向AI智能体的CPU Vera和全新AI模型Nemotron 3 Ultra。此外英伟达公布面向WINDOWS系统个人电脑的新款处理器,挑战英特尔,剑指下一代AI PC入口。英伟达将与宇树科技等全球人形机器人制造商合作开发机器人。

6月1日,英伟达创始人兼CEO黄仁勋在中国台北举办的GTC大会上发表主题演讲。

黄仁勋宣布,英伟达旗下最新数据中心CPU Vera进入量产、推出RTX Spark超级芯片正面进军个人电脑市场,并在机器人和自动驾驶领域持续拓展生态边界,进一步强化其在整个AI产业链中的核心地位。

  • 数据中心CPU量产: 英伟达宣布首款独立数据中心CPU Vera正式进入量产,将于今年第三季度投产。
  • 首批顶级客户确认: OpenAI、Anthropic和SpaceX已确认成为Vera CPU的首批部署客户。
  • 正面硬刚传统巨头: Vera芯片性能达英特尔x86的1.8倍,直接对标英特尔、AMD及云厂商自研芯片。
  • 联手联发科重返PC市场: 英伟达联手联发科、台积电打造RTX Spark超级芯片,十年后再度杀回个人电脑处理器市场。
  • Windows阵营全面倒戈: RTX Spark采用Blackwell架构,今秋将随戴尔、联想、微软等主流品牌高端机型同步上市。
  • 垂直整合颠覆PC链: 英伟达效仿苹果走SoC垂直整合路径,黄仁勋称其为“40年来首次重新定义PC”。
  • DSX平台大幅榨干电力: 推出开源数据中心平台DSX,能让运营商在同等电力预算下多部署40%的加速芯片。
  • 联手宇树科技进军人形机器人: 推出Isaac GR00T人形机器人参考平台,由中国宇树科技H2机器人作为载体。
  • 机器人研究正式“平权”: 该机器人平台支持开箱即用,旨在让前沿机器人研究走出大厂、惠及高校学术机构。
  • 智驾联合中国车圈: 比亚迪、吉利、小米等中国主流车企已全面采用英伟达DRIVE Hyperion自动驾驶平台。

Vera芯片量产,OpenAI等率先采用

英伟达宣布Vera Rubin架构已全面进入量产阶段,Vera CPU将于今年第三季度正式投产,OpenAI、Anthropic和SpaceX将率先在其数据中心部署该芯片。

Vera是英伟达首款专门面向数据中心的独立微处理器,直接对标英特尔Xeon系列、AMD Epyc系列,以及亚马逊Graviton等云厂商自研芯片。黄仁勋表示,Vera在AI核心工作负载上的性能是英特尔x86架构芯片的1.8倍——这也是英伟达首次就CPU性能与行业现行标准展开正面比较。

此举背后有明确的战略逻辑:随着AI工作负载重心从模型训练转向推理与服务部署,通用CPU的地位日益凸显,市场对英伟达GPU加速器是否仍不可或缺的疑虑也随之上升。英伟达通过Vera表明,其希望在这一转型中同样占据核心位置。黄仁勋一再强调,英伟达是唯一能够为数据中心运营商提供全套所需组件的公司,且高度集成化的产品形态使客户无需深厚技术积累即可快速部署。

进军PC市场,RTX Spark正面挑战英特尔

英伟达宣布推出RTX Spark超级芯片,标志着其正式进军个人电脑处理器市场,计划今年秋季率先在高端笔记本和台式机上亮相。

该芯片由英伟达与联发科联合开发,由台积电采用3N工艺代工,内置最多20个核心的CPU与6144个核心的Blackwell架构GPU,两者共享内存,通过NVLink接口互联,运行微软Windows for Arm操作系统。参与推出首批产品的PC品牌包括戴尔、联想、惠普、华硕、宏碁及微软,初期定位高端市场,面向AI开发者、创作者和游戏玩家。英伟达表示,后续将扩展至约30款笔记本和逾10款台式机,覆盖更广泛的价格区间,并将随每代AI处理器同步推出新一代PC芯片。

黄仁勋称,英伟达与微软在这一项目上已合作三年。新芯片能够在本地运行大型AI模型,并支持Adobe Photoshop等主流软件的AI功能,黄仁勋将AI智能体描述为取代鼠标键盘、成为人机交互主要方式的核心技术。

分析人士指出,英伟达此举走的是苹果Apple Silicon的垂直整合路径,将CPU、GPU与AI运算单元整合为单颗SoC,直接向整机厂商输出完整计算平台,目标是整个Windows阵营,这将使英伟达在PC价值链中的地位发生根本性变化。尽管英伟达当前在数据中心的营收规模已大体相当于英特尔与AMD年销售额之和,但其股价今年以来的表现仍落后于费城半导体指数,进军PC市场或有助于向投资者展示其在AI普及终端这一趋势中的布局深度。

DSX平台:同等电力预算下多用40%加速芯片

英伟达推出数据中心软件平台DSX,以开源模式向基础设施运营商提供规划、部署和监控的完整工具套件,用户可按需选取所需组件。

据英伟达介绍,DSX的一项关键优势在于大幅提升数据中心电力管理效率,使运营商在相同电力预算下可额外部署最多40%的英伟达加速芯片——对于受制于供电容量的大型数据中心而言,这一优势尤为显著。黄仁勋表示,借助DSX,用户可以在不花一分钱的情况下对整个工厂进行模拟,在安装任何机架之前验证性能。

英伟达还推出DGX Station for Windows高端工作站产品线,与戴尔等PC厂商合作,计划于今年第四季度开始销售,面向使用Windows系统开发和部署AI软件的企业用户。

人形机器人:携手宇树科技,开放学术研究市场

英伟达宣布与中国机器人初创公司宇树科技合作,推出面向高校及学术机构的Isaac GR00T人形机器人参考平台。

该系统以宇树H2机器人为载体,整合了搭载Blackwell架构GPU的Jetson Thor计算模块、GR00T软件栈,以及由新加坡Sharpa公司制造的五指灵巧手,全身31个自由度,身高约6英尺、重150磅,支持开箱即用。英伟达表示,目前研究机构在使用机器人时需花费大量时间进行配置和调试,此平台旨在解决这一痛点,让前沿机器人研究走出大型科技公司和AI独角兽的圈子,惠及更广泛的实验室。Ai2(西雅图)、苏黎世联邦理工学院(ETH Zurich)、斯坦福大学机器人中心及加州大学圣地亚哥分校高级机器人与控制实验室已确认率先采用。

英伟达副总裁Rev Lebaredian表示,这是"将前沿人形机器人研究从全球最大科技公司和AI独角兽手中解放出来,让每个实验室都能触及"的举措。

宇树科技目前正寻求在上海科创板上市,拟募资42亿元人民币(约6.2亿美元),该公司逾40%的营收已来自中国大陆以外市场。

自动驾驶:DRIVE Hyperion生态浮出水面

英伟达在发布会上进一步披露了DRIVE Hyperion自动驾驶平台的商业落地进展。

英伟达表示,比亚迪、吉利、极氪、小米以及小马智行等中国主流车企和自动驾驶公司,均已采用或正在基于NVIDIA Hyperion平台开发智能驾驶系统。此外,英伟达专门针对自动驾驶出租车场景推出了Alpamayo 2超级开放推理模型,进一步扩展其在出行领域的软件布局。

以下为黄仁勋演讲全文,由AI辅助翻译:

见到大家真好,回家的感觉真好。我把父母带回了家乡,爸妈在哪里?请大家为我的父母鼓掌,也为我们开场环节的明星嘉宾鼓掌。女士们先生们,他们太可爱了,是中国台湾的明星!

今天到场的人非常多,本次演讲正同步直播给中国台湾各地 70 个线下观看点,70 场分会场同步进行,所有人都在收看这场主题演讲。我们有大量内容要分享,也有众多合作伙伴需要感谢。英伟达在中国台湾的生态系统规模之大,令人难以置信。

大多数人提到生态系统,首先会想到我们的软件栈,以及英伟达计算平台之上的开发者生态。但英伟达的生态覆盖上游中国台湾供应链(一切的起点),一直延伸到下游的数据中心,最终触达终端用户。今天我们会讲解几乎整个生态体系。这里汇聚了众多企业,还有我最珍视的生态合作伙伴。

中国台湾拥有全球最丰富、最顶尖的供应链生态,这一点令人惊叹。感谢各位莅临,今年我们的业务共同实现了迅猛增长。昨晚我得知,中国台湾年度 GDP 增速将接近 10%,这一数据十分惊人。

话不多说,我们正式开始。两年前我在这里就提到,AI 正从生成式 AI 迈向全新浪潮,下一波 AI 就是智能体 AI。如今我们可以明确:智能体 AI 已经到来,实用型 AI 正式落地。

一、实用型 AI 到来,智能体重构计算模式

GitHub 是智能体 AI 最早的落地场景之一 —— 软件编码。软件开发是全球最具价值的职业之一,拥有庞大生态:全球约 3000 万至 4000 万专业软件开发人员,另有数百万学生与爱好者。

GitHub 的代码提交数据清晰印证变化:2023 年 3 亿次,2024 年 4 亿次,2025 年 5 亿次;2026 年前几个月,提交量几乎翻了三倍。

这背后的经济价值十分显著:全球 3000 万至 4000 万软件开发者,每年创造约 3 万亿美元薪资价值,驱动全球百万亿级产业增长。如今同等人力投入,产出接近三倍,相当于 3 万亿美元薪资创造了 9 万亿美元生产力,差距极为惊人。这就是 AI 的潜力与价值。

软件工程师的数量正在持续增加。所谓 “AI 会减少就业” 的说法完全是无稽之谈,AI 反而推动企业招聘更多软件工程师。原因很简单:软件工程师的产出价值大幅提升,企业自然会扩大招聘,这一变化很快会体现在经济数据中。

从行业视角来看,实用型 AI 的落地让Token 需求爆发式增长,Token 成为可盈利的收入单元。AI 企业加速生产 Token、搭建更多 AI 工厂,这正是中国台湾算力需求飙升的核心原因,也是各位业务蓬勃发展的关键。

这背后是全新的计算模式:不再是单一大语言模型,而是智能体。今天我们所有的分享,都基于这一核心。

什么是智能体

传统计算是「应用程序 + 代码 + 操作系统」,应用代码在操作系统内运行。

如今的智能体,由一个或多个大语言模型与调度框架组成,框架负责协调智能体完成高效工作。

智能体接收输入后,会完成理解、观察、推理、执行、调用工具,工具可包括电子表格、网页浏览器、数据处理引擎、数据库引擎等。信息路由、上下文处理、环境理解、推理规划、执行动作,全程由软件统一调度。

智能体和人类一样,拥有工作记忆(短期记忆)与长期记忆,内存管理系统至关重要。整套系统即为智能体:大语言模型负责思考,调度框架像操作系统一样连接所有组件,这就是全新的计算模型。

大语言模型的思考、推理、规划、工具调用能力,搭配管理内存、调度、工具使用的框架,让智能体能够完成各类复杂任务。

智能体应用案例

  • 输入指令,AI 直接生成对应代码;
  • 输入需求:制作 GIF 动画,黑色背景上英伟达绿色点阵汇聚成台北 101 大楼,呈现 GTC Taipei 2026 元素,再散开形成英伟达 logo,循环播放,AI 直接完成生成;
  • 输入需求:遥控器电池夹丢失,根据外观创建可用于 3D 打印的 CAD 文件,AI 调用工具直接完成。

这就是未来的计算方式:不再是启动应用、点击输入,而是向 AI 说明需求与意图,AI 生成代码或调用工具,直接输出所需结果。这就是智能体 AI,我们筹备两年,如今终于落地。

智能体 AI 的重大突破之一是工具使用。很多人认为智能体 AI 会让软件公司消亡,事实恰恰相反。智能体数量将爆发式增长,世界不再受人力数量限制,智能体对工具的需求会远超以往。

当下正是软件企业的黄金时代,关键是把软件以智能体可调用的形式呈现,这是行业重大突破。

英伟达的核心宝藏是CUDA X 库。二十年前我们打造了 CUDA 统一加速计算架构,如今拥有 1000 个 CUDA X 库,助力开发者在科学与工程各领域实现突破。这些库都是智能体的高效工具:

  • cuLitho:计算光刻
  • cuOpt:决策优化
  • cuDSS:直接稀疏求解器
  • AIQ:结构化与非结构化文档深度研究
  • Ariel:AI 相关
  • ran warp:可微物理
  • Parabrick:基因组学

这些库的核心是算法,极具价值。

二、智能体计算:分布式异构计算新范式

智能体是终极解耦式分布式计算模型,处理任务时会调动多类计算资源。智能体由模型、调度框架、工具技能、运行环境组成,分别在数据中心不同位置运行:

  • 模型:大脑
  • 调度框架:身体
  • 工具 + 运行环境:工作车间

每一次思考、上下文处理、环境理解、推理规划、执行动作,都会激活一整柜 Grace Blackwell NV Link 72;调用工具时则使用 CPU,工具可兼容 C 编译器、Python、JavaScript 或加速计算。

当前智能体调用工具的方式相对基础,未来会高度成熟,CUDA X 库将成为智能体的核心工具,解决全球关键问题。我们会为 CUDA X 库配套 AI 可学习的使用技能,让智能体高效调用。

工具运行在 CPU、GPU、大语言模型上;安全调度框架运行在 CPU 与英伟达 BlueField DPU 上;整体调度由 CPU 负责。

内存是最大难点:工作记忆(KV 缓存)的存储、压缩、检索,结构化 / 非结构化数据调取,数据间的关联关系,处理逻辑极为复杂。AI 的内存系统将彻底革新存储体系。

这种分布式、异构的计算模式,和传统「软件打包在操作系统内运行」完全不同,这也是我们研发下一代产品的核心原因。

三、Vera Rubin:为智能体时代打造的终极系统

Vera Rubin 并非单一芯片,也不只是 GPU,而是端到端完整系统,包含 GPU、NV Link 72,由 Vera CPU 统一调度。

其配套革命性存储系统、CX9 与 DOCA 软件栈,内置安全处理器,实现数据静态、传输、使用全流程加密,满足机密计算要求 ——AI 模型价值极高,安全至关重要。

Vera Rubin 是英伟达历史上最具雄心的项目,全公司 4 万名工程师全员参与,合作伙伴也深度贡献,堪称行业奇迹。

英伟达早已从 GPU 公司转型为系统公司,Vera Rubin 是有史以来设计最复杂、底层架构最完整的系统。我们的客户最终需求不是购买计算机,而是搭建 AI 工厂,因此英伟达再次转型,成为基础设施级技术提供商。

全球正掀起 AI 工厂建设热潮,这是人类历史上最大规模的基础设施建设。AI 工厂复杂度极高,芯片、机柜、网络、电力、冷却、电网必须端到端协同设计,因为算力就是收入。

英伟达 DSX:AI 工厂最优设计蓝图

DSX 是搭建、运营高效盈利 AI 工厂的参考设计:

  1. 借助 DSX SIM Omniverse 蓝图,合作伙伴可在物理部署前,完成布局规划、电力冷却模拟、网络设计、集成验证、变更测试;
  2. 工厂上电后,DSX OS 负责配置、运营、监控、修复,将硬件转化为可信、多租户、高弹性的 AI 算力;
  3. 现有 AI 工厂电力超配高达 40%,DSX Max Lps 可在同等预算下安全部署更多 GPU,每年新增数十亿美元收入;
  4. 45℃高温液冷技术,降低水耗与能耗,让更多电力用于产生收益的算力;
  5. 动态电力分配、电力平滑技术,优化工厂电力使用;
  6. AI 智能体与 DSX Max Lps 协同,平衡冷却与电力;
  7. DSX Flex 可读取电网实时信号,动态调整工厂电力,让 AI 工厂成为灵活的能源资产。

到本世纪末,将有 100 吉瓦的 AI 工厂上线,英伟达 DSX 能实现最高效率、最低 Token 成本,同时强化电网稳定性。

这是 AI 工厂生态,上游是中国台湾供应链伙伴,下游是 AI 工厂客户。英伟达不只是研发 GPU、打造系统,更是助力客户搭建复杂度极高的 AI 基础设施。

单吉瓦级 AI 工厂的投入,已从 200-300 亿美元升至 500-600 亿美元,很快将达到 800-1000 亿美元。如此高的资本与复杂度,必须一次成功、立即上线。

如今我们通过 Omniverse 数字孪生,在虚拟世界完成巨型系统的设计模拟,再落地实体建设,大幅降低风险与成本。

英伟达产品体系清晰:RTX 面向 GPU、DGX 面向系统、DSX 面向基础设施。凭借全栈技术能力,我们助力小型企业成长为世界级 AI 云服务商,例如 Core Weave、Nebius 等,服务客户包括 Cursor、Black Mountain Labs、Revolute、Shopify、英国电信、谷歌、Naver Cloud、韩国银行、现代、AI Singapore、中国台湾 GMI 等。

AI 将无处不在,每家企业都会被 AI 驱动,每个地区都会建设 AI 基础设施。

算力即收入,算力即利润

AI 基础设施的上线速度、吞吐量、可靠性、使用周期,直接决定收益。单吉瓦电力是固定上限,每瓦吞吐量就是收入,每个 Token 都能创造盈利。

选择错误的架构,即便芯片单价更低,也无法实现高效收益。英伟达全栈整合、底层设计、系统模拟、极致架构优化,让我们实现:

  1. 最快的首 Token 产出、首推理、训练启动速度;
  2. 全球顶尖的每瓦吞吐量、Token 产出效率;
  3. 大规模运营积累的高可靠性,故障间隔极长;
  4. 超长的系统使用周期,软件持续迭代兼容,总拥有成本(TCO)更低。

这就是「算力投入越多,收益越高」的核心逻辑。

各位都在亲身感受这一趋势:中国台湾全产业链工厂高速运转,因为实用型、盈利型 AI 已到来,算力需求成为核心约束,我们需要全力助力全球搭建 AI 工厂。

Vera Rubin 已全面量产,其供应链规模是 Grace Blackwell 的两倍;单台 Grace Blackwell 机柜组装时间从 2 小时缩短至 5 分钟,产能与效率大幅提升,数百万平方英尺的厂房已投入支持,全力扩产 Vera Rubin。感谢所有合作伙伴。

Vera Rubin 是为智能体 AI打造的多机柜集群级系统,专为处理观察、推理、规划、工具调用、海量上下文管理、记忆调度设计。

英伟达的 AI 超算历程:从首台 AI 超算 DGX1,到 Pascal、NV Link,再到首款机柜级 AI 超算 Grace Blackwell,如今推出首款多机柜集群级智能体超算 Vera Rubin。

Vera Rubin 由台积电 3 纳米工艺打造,包含 7 颗全新芯片,搭载美光、SK 海力士、三星的 HBM 内存,计算板集成 6 万亿晶体管、18000 个组件;NV Link 72 负责思考、提示词与上下文理解、推理规划。

全新模块化计算链、PCB 中板设计,整合 Super Chips、ConnectX-9、Super Nyx、BlueField 4 DPUs,无线缆设计,保障 AI 工厂级可靠性;18 个计算链、9 个热插拔 NV Link 交换链、高效液冷汇流排,承载超 5000 安培电流,整套第三代 MGX 机柜包含 130 万个组件。

微软、戴尔、Core Weave 已上线 Vera Rubin NV Link 72 工程机柜;Vera CPU 机柜单柜 256 颗 CPU,液冷设计,负责模型调度、内存管理、工具启动;Grok 3 LPX 实现 40PB/s 内存带宽,超低延迟推理;NV Link 72 保障高吞吐量,Grok LPX 保障低延迟;Vera Bluefield 4 STX 负责 AI 内存、存储处理加速与安全;英伟达 Spectrum X 以太网光子器件,是全球首款 200G 同轴封装光模块交换机。

Vera Rubin 整合 5 大机柜级系统,是智能体专属超算,携手中国台湾 150 家供应链伙伴、数百万平方英尺厂房打造,用极致架构设计,为 AI 时代重新定义计算。感谢中国台湾。

Vera Rubin 不只是为 AI 而生,而是为运行智能体而生,是全球最先进的智能体计算系统。

过去 Hopper 面向预训练,Grace Blackwell 面向推理,推理直接创造收益。复杂模型的推理需要兼顾高响应速度、交互性、吞吐量,难度极高,因此我们打造 NV Link 72,让英伟达 Token 成本全球最低,差距达到数量级。Vera Rubin 则超越推理,面向智能体系统设计。

Vera Rubin 采用无线缆、无软管、无风扇设计,中间 PCB 连接两侧组件,可靠性与弹性大幅提升。

四、Vera CPU:为智能体时代打造的全新 CPU

此前所有 CPU 都是为人类设计,以秒为时间单位,云计算按核心租赁。但智能体没有耐心,以纳秒为时间单位,调用工具、访问数据库需要极致低延迟,等待会直接阻碍执行效率。因此我们全新研发 Vera CPU,专为 AI 智能体时代设计。

Vera CPU 在系统中有三大核心用途:

  1. 配套 Vera Rubin,每台 Vera Rubin 机柜内置 2 颗 Vera CPU,负责 GPU 调度、KV 缓存管理、机柜软件运行;
  2. Grace Bluefield 负责安全隔离;
  3. 承担智能体调度框架、工具调用、数据库与数据服务器访问、高速存储处理。

存储服务器与 CPU 已成为数据中心最昂贵环节的关键路径,AI 工厂的收益核心是 Token 产出,必须保障这一环节不成为瓶颈,因此我们从零打造全新架构 Vera CPU。

Vera CPU 四大核心优势

  1. 全球最高单线程性能:每时钟周期可获取、解码、执行 10 条指令,IPC(每时钟周期指令数)全球第一;
  2. 极致带宽:内核间带宽、系统总带宽全球顶尖,采用光速级互联架构,3.6TB/s 截面带宽,无芯片边界延迟;
  3. 领先接口:首款 PCIe Gen 6 CPU,搭载 LPDDR5X,带宽达 1.2TB/s,是高端 CPU 的 2-3 倍;
  4. 超高能效:智能体数量将远超人类,需在不占用 Token 生成电力的前提下,高密度部署 CPU,能效至关重要。

对比高端 x86 CPU,Vera CPU 的真实单线程性能提升幅度史无前例。

在智能体时代,CPU 是指挥,GPU 是乐团。传统 CPU 为旧时代设计,最大化单插槽核心数、虚拟化分时租赁;如今 CPU 成为 GPU 利用率的瓶颈,直接影响 Token 吞吐量、延迟与用户体验。

Vera CPU 内置英伟达 Olympus 核心,针对现代数据中心工作负载(分支密集型 Python 运行时、工具调用、沙箱代码执行)优化:

  • 神经分支预测器,每周期处理 2 个分支;
  • 10 宽度解码引擎,单周期处理更多任务;
  • 大型乱序执行引擎,保障指令流畅运行;
  • 高级预取器与图引擎,预判数据路径;
  • 支持 LPDDR5X,同时纠正多类错误,内存峰值延迟比 x86 低 40%;
  • 第二代可扩展一致性架构,88 颗 Olympus 核心统一单片互联,核心通信速度比传统 CPU 快 50%;
  • NV Link 芯粒互联,直接连接 GPU,可多插槽扩展。

Vera CPU 智能体沙箱性能是 x86 的 1.8 倍,独立机柜可运行智能体沙箱、工具、代码、数据管道,与 Ruben GPU 紧密协同;Vera Bluefield 4 STX 支撑上下文内存、AI 存储、计算、网络、存储一体化。

Vera CPU 将成为英伟达新的核心增长引擎,全球企业已同步适配。Grace 已全面普及,Vera 将成为全球最优化的智能体 CPU。

实际场景中,Vera CPU 运行 SQL 速度提升 3 倍,实时流处理速度提升 6 倍,性能提升达到数量级,这在 CPU 领域极为罕见。全球厂商均已表态支持 Vera CPU,它开启了智能体专属 CPU的全新市场,规模将超越传统 CPU 市场。

五、英伟达企业 AI 工具包:让每家企业都能打造智能体

智能体是未来十年的计算模式,每家企业都会成为智能体企业,都需要安全运行智能体、搭建专属智能体的方案。英伟达推出企业 AI 智能体工具包,我们已为此筹备多年。

企业搭建智能体需要四大核心:

  1. 模型:大语言模型,越智能、低成本、高速越好;
  2. 调度框架:协调智能体全流程;
  3. 工具与技能:CUDA X 库等高效工具;
  4. 运行环境:整合所有组件的操作系统。

英伟达智能体工具包提供:

  • 可定制的世界级开源模型;
  • 兼容各类智能体(Cloud Code、Codex 等);
  • 开源安全调度框架 Open Shell,保障企业级安全、隐私、权限、身份,全球广泛采用(红帽、Canonical、微软等);
  • 全栈优化适配英伟达 AI 平台,支持云端、本地、终端部署。

案例:芯片设计超级智能体

英伟达与 Cadence 合作打造芯片设计超级智能体,由 Codex/Cloud Code 调度,以 RTL、架构图、规格书为输入,实现设计验证全流程自动化:

  • 调用 Cadence Chipstack 启动 RTL 验证循环;
  • 依托 Nemotron 模型,Open Shell 保障安全;
  • 调用 RTL 生成、测试台创建、回归测试、调试子智能体;
  • 数百次仿真、形式验证同步运行,快速定位修复漏洞;
  • 验证周期从数周缩短至数小时,效率提升超 40 倍。

英伟达将部署数十万计 Cadence 超级智能体,加速芯片研发。这正是模型、调度框架、加速库工具、运行环境四大核心协同的成果。

Nemotron 3 Ultra:开源旗舰模型

今天我们发布Nemotron 3 Ultra开源模型,提供模型、训练数据、训练脚本全开源,联合全球伙伴共建数据集,是全球最优质的开源模型体系之一。

Nemotron 3 Ultra 核心优势:

  • 速度提升 5 倍:采用 SSM 状态空间模型 + 混合专家混合架构;
  • 成本降低 30%:推理算力与耗时大幅优化;
  • 完全开源,支持企业定制优化。

我们正在研发 Nemotron 4,全栈工具包让全球企业都能像 Cadence 一样打造专属智能体。英伟达已与 Cadence、Crowdstrike、Palantir、SAP 等企业深度合作,智能体不会颠覆行业,反而创造史上最大机遇。

六、RTX Spark:与微软联手,40 年来重新定义 PC

40 年前,Windows 系统通过解耦、抽象、开放架构、驱动动态安装、多媒体 API,让 PC 普及全球。40 年后,英伟达与微软重新发明 PC,面向 AI 智能体时代。

智能体将运行在 AI 云、企业、个人 PC 等全场景,搭载自主智能体的 PC,能理解用户、交互、处理文件、自主调研,实现全新交互体验。

全新操作系统是传统系统 + 大语言模型,相当于现代版 DirectX,支持多模态输入输出、计算机视觉、音视频生成;应用层被智能体运行时替代,这就是现代应用 —— 智能体。

RTX Spark 核心配置

  • Blackwell RTX GPU,6144 CUDA 核心,1PFLOPS AI 算力;
  • 与联发科合作定制 20 核 Grace CPU;
  • NV Link 互联,128GB 统一内存;
  • 台积电 3 纳米工艺,700 亿晶体管;
  • 与微软深度协同,打造 Windows 智能体平台。

RTX Spark 笔记本完美兼容英伟达全软件栈,CUDA、物理模拟、生物、基因组、AI、图形全场景支持,兼容 Windows 全生态,同时原生运行智能体。

应用场景

  • 建筑设计:本地智能体调用 Rhino、Blender,根据指令完成场地建模、布局设计、渲染,生成写实效果图,复杂工作流简化为指令交互;
  • Adobe 生态:Photoshop、Premier 核心架构重构,速度提升 2 倍,支持智能体交互。

全球 PC 行业 100% 支持 RTX Spark,我们推出三大全新 Windows 设备:笔记本、台式机、工作站,100% 兼容 Windows、CUDA、英伟达 AI 与 Tensor Core,是 40 年来首次彻底重构的 PC 产品线。

  • RTX Spark 台式机:24 小时不间断运行本地智能体,无算力焦虑,连接全屋设备,成为家庭 AI 中心;
  • DGX Station 4 Windows:768GB 内存,可运行万亿参数模型,20PFLOPS 算力,8TB/s 内存带宽,专为大模型、智能体开发者设计。

未来 PC 将彻底颠覆现有形态,就像手机从通话工具变成智能终端。未来每个家庭都会配备 AI 超算,运行专属智能体,成为像 R2D2 一样的智能助手,这次 PC 革命的意义,等同于功能机到智能手机的跨越。

英伟达将持续迭代 PC 产品线,每代架构都覆盖笔记本、台式机、工作站,全球 PC 生态全员参与,共启全新篇章。

七、物理 AI:Cosmos 3、Alpha Mile 2 与人形机器人

智能体 AI 本质是数字机器人,未来将覆盖全场景设备:机器人、自动驾驶、卫星、农业设备、工业设备、基站等,数百亿智能体系统将遍布全球。

物理 AI 的核心难点是数据:语言模型数据来自人类视角,而机器人需要第一视角感知数据,全球视频数据多为第三人称,因此物理 AI 数据获取极难。

英伟达通过三大路径突破:

  1. 远程操作(人类演示);
  2. 仿真模拟(Omniverse);
  3. 第三人称数据转第一视角,最终打造世界基础模型。

Cosmos 3:物理 AI 开源基础模型

今天发布Cosmos 3,是物理 AI 的前沿开源模型,基于全新 Transformer 混合架构,支持像素、动作、声音、语言输入,实现推理、规划、指令生成,登顶全球多项榜单。

Cosmos 3 核心能力:

  • 多模态大模型:感知物理世界,描述、识别关键信息;
  • 世界模型:根据文本 / 图像 / 视频,生成物理精准的合成视频;
  • 仿真器:闭环训练策略;
  • 动作世界模型:预测未来,为各类机器人生成动作指令。

Cosmos 3 完全开源,支持开发者定制优化,成为专属物理 AI 模型。

Alpha Mile 2:自动驾驶开源模型

今天发布Alpha Mile 2自动驾驶开源模型,全球约 80% 汽车厂商已接入英伟达 Hyperion 平台,97% 移动出行服务与我们协同,搭载 Alpha Mile 2 的 Hyperion 系统,将实现全球覆盖。

Alpha Mile 2 是全球首款推理型自动驾驶系统,能自主思考、判断、决策,应对复杂路况。

Isaac Groot:人形机器人参考平台

英伟达 Isaac Groot 是人形机器人开放开发平台,提供开源模型、仿真训练库、数据生成工具、机器人计算机,快速部署研发:

  1. Isaac Sim 搭建仿真环境;
  2. Isaac Teleop 完成真实 / 仿真机器人演示采集;
  3. Omniverse 与 Cosmos 生成合成数据,单条演示扩至数千条;
  4. 训练策略、仿真评估、部署 Jetson Thor 运行。

今天发布Isaac Groot 人形机器人参考设计:

  • 单只手 25 个自由度,全身 31 个自由度;
  • 身高 6 英尺,体重 150 磅;
  • 搭载 Thor 芯片,全栈软件集成。

该平台专为高校、研究机构打造,降低人形机器人研发门槛,助力前沿研究。

结尾

过去半年,计算机行业被智能体彻底改变,实用型 AI 落地,智能体计算模式成为核心。这一模式将复制到云端、本地、PC、机器人、卫星、基站、工厂等全场景。

Vera Rubin 全面量产,专为智能体打造;Vera CPU 开启智能体计算新时代;英伟达与微软重构 PC 生态;企业智能体工具包赋能全行业;物理 AI 与机器人技术持续突破。

感谢各位的合作与支持,明年我们将取得更辉煌的成就。欢迎来到 Computex,祝大家展会顺利!

风险提示及免责条款
市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。
相关文章