本文作者:张逸凡
编辑:申思琦
来源:硬AI
英伟达的新一代芯片Blackwell似乎遇到了一些小麻烦。
8月1号,研究机构ALETHEIA报告称英伟达的Blackwell芯片可能延迟。随后,8月2日,小摩和大摩各自发表了分析报告。总体来看,Blackwell芯片延迟的影响没那么糟糕。
1、小摩观点
• 延迟原因:小摩认为主要有三方面的原因,其中,芯片设计问题是核心原因。
a. B100/B200芯片设计问题;
b. CoWoS-L封装良率问题:仅60%,远低于CoWoS-S的90%以上水平;
c. 系统级问题:如发热和液漏等;
• 供应链影响:预计B100的延迟将持续一个季度,但GB200的出货时间基本保持不变。
2、大摩观点
• 延迟原因:大摩认为这并非延迟,而是改进。英伟达希望通过“重新设计”进一步提高Blackwell的稳定性。
• 变化:由于CoWoS-L封装良率问题,B200A将改用CoWoS-S封装。
• 供应链影响:虽然Blackwell在台积电暂停生产两周,但第四季度产能扩大后可以追回延迟,并按期交付Blackwell。
总体来看,英伟达的芯片延迟主要因芯片设计问题、CoWoS-L封装良率低及系统级问题(如发热、液漏等)。
3、专家解读
周末,蓉和半导体 CEO 吴梓豪结合自身多年的Fab经验和供应链消息,撰写了一篇《英伟达新一代芯片Blackwell翻车过程全纪录》,详细解释了此次延迟的原因和供应链的影响。
吴梓豪表示,此次“重新设计”的芯片是b102,而b102是所有Blackwell芯片的基础。
- b102:由一个GPU die + 4个HBM3e组成;
- b100:由两个b102组成;
- GB200主板:由两颗b100 + 一颗Grace CPU组成;
- 服务器:由主板和各种系统级配件组成(液冷、铜缆等);
底层基础芯片(b102芯片)的重新设计将有可能影响后续主板、服务器乃至整个供应进度。
4、Blackwell延迟预期
此前市场预期Blackwell三季度开始排产,四季度批量出货,2025年第一季度正式大量出货服务器。
小摩和吴梓豪都认为,芯片问题可能影响原计划的三季度排产,但随着台积电四季度产能扩大,三季度的延迟可以追回。总体来看,今年Blackwell的出货量虽然会减少,但不会减少太多,且对2025年一季度服务器的出货影响不大。
值得注意的是,与市场预期不同。英伟达在第一季度业绩会上透露,Blackwell芯片将从第二季度开始生产,并在第三季度逐步增加出货量,预计今年将产生显著的Blackwell收入。大摩的报告也指出,这次“重新设计”实际上是对芯片的改进而非延期。
因此,目前市场对台积电的具体排产计划存在不同解读。如果生产从第二季度开始,并在第三季度逐步提升产量,那么这次延迟确实可能对供应链产生一定影响。
5、其他问题
• CoWoS-L封装良率问题:小摩表示CoWoS-L良率仅60%,但吴梓豪与野村研究团队确认后表示实际良率为90%出头。此外,英伟达这种Fabless厂商通常会有Plan B,正如大摩提到的将采用CoWoS-S封装(目前良率99%)取代CoWoS-L,不影响服务器出货。
• 发热问题:大摩认为,散热和高电压等问题在新产品引入过程中较为常见,预计不会对大规模生产计划造成实质性影响,量产将有序推进。
• 液漏问题:水冷散热的主要零件,如水冷板、分歧管、CDU及快接头(QCD)中,快接头处最容易发生漏液,而具体情况需要等到实际导入后才更明朗。
6、供应链影响
• 英伟达:2024年下半年进入H系列服务器的出货高峰,搭载H系列芯片的服务器是英伟达今年的主要业绩来源。而Blackwell今年第三季度本来就没有收入预期,第四季度Blackwell服务器出货也不高。服务器出货原本就是2025年的事,因此总体对英伟达业绩影响不大。
• 台积电:今年原计划量产的CoWoS-L预期下修2万片(从4万多片下修到2万片),会体现在台积电第四季度或明年第一季度的业绩上。
• 光模块:B100标配800G光模块,但光模块配套服务器出货,对2024/2025年800G需求没有影响。
整体来看,此次英伟达Blackwell芯片延迟主要是芯片设计问题,且影响并没有最初想象的那么严重。并非会产生几个月的供应链延误,CoWoS-L封装良率也不像市场传言的那么低。正如英伟达接受采访时所说:“Blackwell的样品试用已经广泛开始,产量有望在下半年增加。”
本文来自微信公众号“硬AI”,关注更多AI前沿资讯请移步这里