赛道Hyper | 英伟达：除海力士，也要美光HBM3E

2024/02/04 09:43

2024，HBM3E的天下。

作者：周源/华尔街见闻

英伟达下一代AI加速卡B100（Blackwell架构）的存储器规格，将采用HBM3E。这种规格的存储器，目前只有SK海力士、三星电子和美光能提供。

华尔街见闻从供应链多个渠道独家获悉，几乎与SK海力士同时，美光也成为B100存储器供应商。目前三星电子还没进B100的存储器供应链。

根据此前供应链消息，B100提前半年，将在今年二季度上市。

什么是HBME？英伟达B100牛在何处？

B100拉动HBM3E产能喷发

AI服务器热潮带动了AI加速卡的需求。高频宽存储器HBM也成为AI加速卡（GPU）的关键DRAM模块。

据Gartner的预测报告，2023年全球HBM营收规模约为20.05亿美元；预计到2025年，HBM的市场规模将翻倍成长至49.76亿美元，增长率高达148.2%。

目前，SK海力士、三星、美光是全球仅有的三家HBM供应商。行业数据显示，2022年HBM市场，SK海力士占据50%的市场份额，三星占比40%，美光占比10%。

英伟达H200是首次采用HBM3E存储器规格的AI加速卡。HBM3E使GPU存储器带宽从H100的每秒3.35TB扩展至4.8TB，提高1.4倍，存储器总容量也从H100的80GB提高至141GB，容量提高1.8倍。

此前有供应链消息称，英伟达原本预计在2024年第四季度推出的下一代AI加速卡B100，目前将提前至2024年二季度推出。

据目前有限的信息显示，B100采用台积电3nm工艺制程混合更复杂的多芯片模块（MCM）设计。英伟达在AI GPU市场占比了80%以上的市场份额，若B100能提前推出，则英伟达将进一步巩固在AI领域的领先优势。

2023年下半年开始，SK海力士、三星和美光这三家HBM供应商基本同步开启了HBM3E的测试，预计从2024年第一季度能实现批量供应。

华尔街见闻从供应链多个渠道独家获悉，美光和SK海力士一样，都已成为英伟达B100的存储器供应商，提供的产品均为HBM3E。

美光CEO Mehrotra曾透露，美光专为AI和超级计算机设计的HBM3E预计2024年初量产，有望于2024会计年度创造数亿美元的营收。Mehrotra还对分析师表示，“2024年1-12月，美光HBM预估全数售罄”。

美光科技位于中国台湾地区的台中四厂于2023年11月初正式启用。美光表示，台中四厂将整合先进探测与封装测试功能，量产HBM3E及其他产品，从而满足人工智能、数据中心、边缘计算及云端等各类应用日益增长的需求。

HBM全称High Bandwidth Memory，直译高带宽内存，这是一种新型CPU/GPU内存芯片。从物理结构看，就是将很多个DDR芯片堆叠起来，再和GPU封装在一起，实现大容量、高位宽的DDR组合阵列。

一般来说，一张AI加速卡，物理结构是中间是die的GPU，左右两侧的die是DDR颗粒的堆叠HBM。

die，是指裸片，即将硅晶圆用激光切割而成的小片。die是芯片还未封装前的晶粒，是硅晶圆上一个很小的单位。

Chip，即芯片，晶圆经过切割、测试，由完好的、稳定的、足容量的die封装而成，这是半导体元件产品的统称。

晶圆就是wafer，这是制作硅半导体所用的硅晶片，原材料是硅，圆形。一般来说，晶圆的尺寸是6英寸、8英寸或12英寸不等。可在晶圆上加工制作成各种电路元件结构，成为有特定功能的集成电路产品。

与Hopper/Ada架构不同，Blackwell架构将扩展至数据中心（IDC）和消费级GPU。B100最大的技术变化在于底层架构很可能有重大调整：英伟达将采用新的封装技术，将GPU组件分成独立的芯片。

虽然具体芯片数量和配置尚未确定，但MCM的设计方式，将使得英伟达在定制芯片时具备更大的灵活性。

现在，还没有足够的信息显示英伟达B100采用的哪种3nm工艺。台积电相关工艺包括性能增强型N3P和面向HPC（高性能计算：High performance computing）的N3X；此外还包括N3E和N3B，前者由联发科采用，后者则被苹果用于A17 Pro的定制。

美光目前正在生产 HBM3E gen-2内存，采用8层垂直堆叠的24GB芯片。美光的12层垂直堆叠36GB芯片将于2024年第一季度开始出样。这将与半导体代工运营商台积电合作，将其Gen-2 HBM3E用于人工智能和HPC设计应用。

HBM3E是HBM3的扩展版本，内存容量144GB，提供每秒1.5TB的带宽，相当于1秒能处理230部5GB大小的全高清电影。

作为一种更快、更大的内存，HBM3E可加速生成式AI和大型语言模型，同时能推进HPC工作负载的科学计算。

2023年8月9日，黄仁勋发布GH200 Grace Hopper超级芯片，这也是HBM3E的首次亮相。因此，GH200 Grace Hopper成为全球首款HBM3E GPU。

GH200由72核Grace CPU和4PFLOPS Hopper GPU组成；每个GPU的容量达到H100 GPU的1.7倍，带宽达到H100的1.55倍。

与H100相比，GH20系统共有144个Grace CPU核心、8PFLOPS计算性能的GPU、282GB HBM3E内存，内存容量达3.5倍，带宽达3倍。若将连接到CPU的LPDDR内存包括在内，那么总共集成了1.2TB超快内存。

英伟达指出，内存带宽对于HPC应用程序至关重要，因为能实现更快的数据传输，减少复杂的处理瓶颈。对于模拟、科学研究和人工智能等内存密集型HPC应用，H200更高的内存带宽可确保高效地访问和操作数据。与CPU相比，获得结果的时间最多可加快110倍。

TrendForce集邦咨询研究指出，2023年HBM市场主流为HBM2e。英伟达A100/A800、AMD MI200以及多数CSPs自研加速芯片皆以此规格设计。

同时，为顺应AI加速器芯片需求演进，各原厂计划于2024年推出新产品HBM3E，预期HBM3与HBM3E将成为2024年市场主流。2023年主流需求自HBM2e转往HBM3，需求比重分别预估约50%和39%。

随着使用HBM3的加速芯片陆续放量，2024年市场需求将大幅转往HBM3；2024年将直接超越HBM2e，比重预估达60%；同时，受惠于更高的平均销售单价（ASP），将带动2024年HBM营收显著成长。

TrendForce集邦咨询此前预估，由于HBM3平均销售单价远高于HBM2e与HBM2，故将助力原厂HBM领域营收，可望进一步带动2024年整体HBM营收至89亿美元，年增127%。

据Semiconductor-Digest预测，到2031年，全球高带宽存储器市场预计将从2022年的2.93亿美元增长到34.34亿美元，在2023-2031年的预测期内复合年增长率为31.3%。

由于HBM是与GPU封装在一起的，因此HBM的封装通常由晶圆代工厂完成。HBM大概率会成为下一代DRAM高性能解决方案，为快速发展的数据中心及云计算人工智能提供更高的AI/ML性能与效率。

尽管美光在HBM市场的占比仅约10%，但美光正在加速推进更新的HBM4和HBM4e研发，这比SK海力士跑的更快。

为提高内存传输速率，下一代HBM4可能要对高带宽内存技术做出更实质性的改变，即从更宽的2048位内存接口开始，故而HBM4会在多个层面上实现重大技术飞跃。

美光公司在2023年曾表示，“HBM Next”（即HBM4）内存将于2026年左右面世，每堆栈容量介于36 GB-64 GB，每堆栈峰值带宽为2TB/s或更高。

风险提示及免责条款

市场有风险，投资需谨慎。本文不构成个人投资建议，也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资，责任自负。