黄仁勋的棋局:AI算力的每一条路,都有英伟达在等候

研外之意
黄仁勋在中国台北宣布两件事:CUDA首次塞进笔记本,万亿参数推理搬上企业桌面。这不是英伟达在抢云厂商生意,而是把收费口从一个扩成三个——数据中心、背包、桌边,无论AI跑在哪里,英伟达都守在路口等着收钱。

黄仁勋今天在中国台北做了两件事:把 CUDA 塞进了笔记本,把万亿参数推理搬到了桌边。

这不是英伟达在和云厂商抢生意。AWS、Azure、Google Cloud 是英伟达最大的几个客户,每年向它采购数百亿美元的 GPU。英伟达不会跟自己的金主动刀。

真正发生的事是:英伟达在扩张收费口。以前 AI 算力只有一条路——买英伟达的 GPU 放进云厂商的数据中心。现在多了两条:RTX Spark 笔记本,DGX Station 桌面机。无论你选哪条,英伟达都在路口等着。黄仁勋管自己叫"基础设施公司",这句话的意思是:AI 跑在哪里不重要,重要的是英伟达铺了路。

CUDA 第一次进了背包

英伟达三十年真正的护城河不是 GPU,是 CUDA。750 万开发者在上面工作,PyTorch、TensorRT、TensorRT-LLM、llama.cpp,主流 AI 框架的最优路径全在这里。二十年建成,没有任何一家公司复制过。

麻烦是 CUDA 一直被关在数据中心里。云端写的代码带不进轻薄本,高通 Snapdragon X 做了很多,就是没有 CUDA,苹果 M 系列是另一个世界。

RTX Spark 拆掉了这道墙。20 核 ARM CPU 加 Blackwell GPU 的 6144 个 CUDA 核,128GB 统一内存,AI 算力 1 PetaFLOP,塞进 14 毫米厚的笔记本。英伟达已与 100 家 Windows 软件商谈妥,TensorRT、PyTorch CUDA 后端、TensorRT-LLM 原生支持。在数据中心写了三年 CUDA 的工程师,拿起 RTX Spark 笔记本,理论上不需要改一行代码。

高通碰上的麻烦不是算力输了,是叙事失守了。Snapdragon X 花三年把 Windows on ARM 的口碑做起来,能效比终于接近苹果——唯一没拿下的是 AI 开发者。那批人一直站在场外,等一台能跑 CUDA 的 Windows 笔记本。

英伟达带着 CUDA 来了,他们等到了。

Snapdragon X 不是没有筹码。美国 800 美元以上 Windows 笔记本市场它占了 10%,80 多个 OEM 设计在跑,X2 Elite 今年上半年发布,NPU 直奔 80 TOPS,先发优势是真实的。但没有 CUDA,高通在 AI 开发者那里永远只能是备选项。

桌边开了第二个收费口

另一个产品的逻辑完全不同,目标客户也不一样。

DGX Station for Windows 基于 GB300 Grace Blackwell Ultra 芯片,本地跑最高 1 万亿参数模型,支撑数百个 AI agent 并行,定价 8 万到 12.5 万美元,Q4 上市,华硕、戴尔、技嘉、惠普、MSI、超微出货。

这台机器的买家不是个人消费者,是那些 AI 推理需求足够稳定、数据足够敏感、不想每个月给云厂商开大额账单的企业。金融机构的风控模型、律所的合同审阅、医疗机构的影像分析——这类工作负载每天密集运行,用云端 B300 专用实例按小时计费,10 万美元的桌面机 4 到 6 个月就能回本,之后全是节省。

注意英伟达选的 OEM 合作方:华硕、戴尔、惠普、超微,全是企业级渠道的主力,不是消费品牌。目标客户写在配置清单里。

DGX Station 还有一个隐性优势是纯粹的数据合规。云端推理意味着数据要出本地网络,金融监管对客户数据的跨境流动越来越严,医疗数据的隐私规范也在收紧。对这类企业,"数据不出门"不是锦上添花,是硬性要求。他们不是因为算便宜才买 DGX Station,是因为别无选择。

这是英伟达在企业算力市场开的第二个收费口——第一个是云厂商数据中心里的 GPU,第二个是企业自己桌边的 GPU。两个口都是英伟达的货,两笔钱都进英伟达的账。

云厂商的处境,不是"被抢",是"被多了一个选项"

英伟达是云厂商最大的硬件供应商,双方不是竞争关系。DGX Station 卖出一台,英伟达收一笔硬件钱;云厂商的数据中心扩容,英伟达收更多 GPU 款。两件事可以同时发生,而且大概率会同时发生——AI 推理市场每年 40% 以上的速度在增长,总盘子够大,容得下本地化和云端同时膨胀。

真正受影响的,是那些原本"只能上云"的场景开始有了本地选项。对云厂商来说,这压缩的不是营收规模,而是议价空间——当企业采购负责人拿着 DGX Station 的报价坐到谈判桌上,云厂商的价格弹性就没有以前那么足了。

AWS 和 Google 这两年也在押注自己的推理芯片——AWS Trainium、Google TPU——部分原因正是为了减少对英伟达的依赖。DGX Station 的出现进一步复杂化了这个局面:云厂商既要向英伟达采购 GPU,又要在推理层面跟英伟达自家的桌面硬件竞争。这个结构性矛盾不会在一两个季度内爆发,但随着本地推理规模的扩大,云厂商和英伟达之间从纯粹的供应商关系,会慢慢走向更复杂的竞合。

微软夹在中间最难受。它是 RTX Spark 最核心的合作方,和英伟达一起把 Windows 改造成 AI agent 操作系统,Surface Laptop Ultra 是第一台 RTX Spark 笔记本,两家站在一条战线上。但微软的 Azure 是全球最大 AI 云服务之一,现在需要跟合作伙伴自家的桌面机去竞争部分推理工作负载。这个矛盾短期不会撕裂,但值得看它怎么演。

苹果的护城河,比 RTX Spark 更深

RTX Spark 发布时苹果被直接点名,媒体几乎一致的解读是:冲着 M5 来的。

不全对。苹果的护城河不在芯片性能。M5 Max 内存带宽 153GB/s,跑超过 24GB 参数量的大模型有架构优势,但更深的壁不在这里——Final Cut Pro 没有 Windows 版,Logic Pro 没有 Windows 版,创意工作流在 macOS 上积了十几年,一块更快的 GPU 换不动它。

Adobe 宣布重构 Photoshop 和 Premiere Pro 支持 RTX Spark,是英伟达在创意侧最重的一手牌,但软件重构到用户真正迁移,中间有漫长的习惯替换。

英伟达短期能从苹果身上撬动的,只有 AI/ML 开发者——这批人本来就在 Windows 和 Linux 上用 CUDA,RTX Spark 给了他们一台更便携的机器,不是从苹果手里抢人。苹果真正需要认真对待的版本是 2028 年 Rubin Spark 成熟之后,不是今天秋天。

英伟达自己藏着的那道题

规格表里有一行英伟达没有大声说:RTX Spark 集成 GPU 性能对标 RTX 5070。

英伟达靠独显赚了三十年钱,Gaming FY2026 全年 160 亿美元,同比增长 41%。如果 RTX Spark 真到了 RTX 5070 的性能水平,高端笔记本买家以后可能不再需要一张独立显卡——那张"显卡"被整合进 SoC 了,英伟达还是在收那笔钱,只是换了形式。

短期独显仍有功耗和绝对性能的上限优势。但苹果 2020 年推 M1 时所有人都说独显不会死,三年后搭 Intel 独显的 MacBook 从货架上消失了。英伟达在主动选这条路,赌 AI PC 带来的增量市场足够大,能填上独显收缩的坑。不一定错,但代价比发布会上看起来的高。

该盯什么

秋季是真正的验证窗口。第一批 RTX Spark 笔记本的价格上架,开发者在真实设备上跑起 CUDA,故事才会从 Computex 舞台走进财报。

最重要的两个数字:OEM 定价和 Windows ARM 兼容性测试结果。定价预期 1400 美元起,超过 1800 美元需求预期就会滑坡;兼容性如果走高通入场时的轨迹,还要 12 到 18 个月才能成熟,这段时间高通的市场积累不会停着等。

中期看高通 X2 Elite 的跑分数据和 DGX Station 的首批企业客户公告——前者告诉你高通的反击力度,后者告诉你企业本地化推理的真实需求规模。若云厂商开始主动下调推理定价来应对 DGX Station,那说明竞争压力已被内部确认,定价逻辑的重新评估会来得更早。

资产上,NVDA 是主线,收费口从一个变成三个,TAM 在扩张,秋季 OEM 定价是近期分水岭。QCOM 是最直接的压力标的,AI 开发者叙事受损,但消费端有韧性,X2 Elite 窗口内有反弹空间。云厂商短期不受影响,中期承压的是议价权而非营收体量,两件事不是一回事。MSFT 双面下注,净效应看推理规模化速度。ARM 和联发科是确定性受益的小标的。

风险提示及免责条款
市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。
相关文章