作者:周源/华尔街见闻
最近,英伟达联合创始人兼CEO黄仁勋在台北Computex 2024展更新了AI GPU技术路线图,同时黄仁勋还澄清了三星电子HBM(高带宽存储器:High Bandwidth Memory)并没有因为过热问题而没有通过英伟达质量测试。此事意味着三星电子的HBM3e(第五代)将很快进入英伟达AI加速卡供应链。
黄仁勋说,“我们需要HBM数量非常大,因此供应速度至关重要。我们正在与三星、SK 海力士和美光合作,我们将收到这三家公司的产品。“
之前有消息称,SK海力士和美光的HBM产能已排到2025年底,一方面说明英伟达需要的HBM产能确实够多;另一方面,也在侧面说明HBM产能问题会成为英伟达AI加速卡出货量的障碍。
从HBM的技术演进史可以看到,HBM原本作为GDDR的替代品。HBM技术迭代很快,性能越来越强,但成本也越来越高。
实际上,GDDR如今也已非昔日吴下阿蒙:今年3月6日,固态技术协会(JEDEC)确定了JESD239 GDDR7显卡技术规范标准,性能较GDDR有巨幅提升,已有迹象显示出GDDR7的部分性能正在跨越To C消费级范畴,迈向To B的HPC(高性能计算)领域。故而,GDDR7也开始有了弥补高成本HBM缺陷的实力。
新战场:GDDR7来了
6月4日,美光宣布开始为下一代GPU提供GDDR7内存样品:有28GB/s和32GB/s两种速率。其中,32GB/s GDDR7提供的内存带宽比GDDR6高出60%;在384位总线上,内存带宽能达到1.5TB/s。GDDR6在RTX 4090等GPU最高带宽为1TB/s。
美光GDDR7采用其1β (1-beta) DRAM 技术制造。在最新路线图中,美光公布了到2026年,达到36GB和24GB+的内存模块;三星电子的目标是实现32GB的速率,但没有公布中期速率目标。
今年3月,三星电子和SK海力士在英伟达GTC大会上也披露了各自的GDDR7技术参数。现在,三家主流供应商等于又开辟了一个新战场:GDDR7。
按照不同应用场景划分,JEDEC将DRAM分成标准DDR、LPDDR和GDDR三类。其中,DDR主要应用于服务器和PC端(桌面),LPDDR主要应用于手机端和PC(笔电),GDDR的主要应用领域为图像处理领域。
在DARM产业格局方面,三星、SK海力士和美光三足鼎立。当前代际DDR5/LPDDR5主流市场的主要竞争由这三家展开。此外,中国台湾存储企业华邦及南亚科技,中国大陆存储企业长鑫存储也将目光聚焦在这块市场。
什么是GDDR?
GDDR,英文全称Graphics Double Data Rate:双图像倍数据速率。这是一种专为图形处理单元(GPU)设计的同步双数据速率动态随机存取存储器(SDRAM)。
1998年,三星电子推出业界首款16 Mb GDDR内存芯片。自此,GPU和CPU内存开始有了各自独立的技术路线和产品。最初,GPU显卡内存和CPU内存可以通用。1998年之后,GPU开始有专用显存——GDDR。
3月6日,JEDEC发布JESD239 GDDR7显卡技术规范,旨在提供更高带宽、更高数据传输速率、更高能效和更大存储容量,以支持未来高性能计算应用的发展。
目前,市场首批GDDR7显存容量仅2GB(16Gb),与GDDR6/6X一致。JEDEC表示,未来会有3GB、4GB、6GB甚至8GB。首发搭载GDDR7的是英伟达RTX 50系列和AMD RX 8000系列。
据JEDEC披露,JESD239 GDDR7是首款使用脉冲幅度调制(PAM)接口作高频操作的JEDEC标准DRAM。
GDDR7的带宽是GDDR6的两倍:即192GB/s。这通过了增加独立通道数量至4个实现。GDDR7也支持16Gbit至32Gbit的密度,包括支持双通道模式,可实现系统容量的翻倍,孤儿能满足未来图形、游戏、计算、网络和人工智能应用对高内存带宽不断增长的需求。
与HBM通常用于超算(高性能计算:HPC)中心AI算力集群不同,GDDR主要用于游戏、专业图形设计/渲染、科学和工程模拟、虚拟现实、可视化应用(消费级)和AI边缘计算的ML(机器学习)。
下半年三巨头角逐
美光GDDR7内存样品的工作电压为1.2V(前代GDDR6工作电压为1.35V),与JEDEC的GDDR7技术规范吻合;工作效率相比前代提升50%。之所以能实现这一点,主要是因为美光采用了分割电压平面、部分设备运行和休眠模式。
此外,美光还采用FBGA更薄的封装高度(1.1mm对比1.2mm)和高热导EMC封装,故而达成了65%更高的热阻,这为台式机和笔电提供了更高效的热管理。
这些特性,除了更进一步提升美光GDDR7在GDDR传统应用领域的性能,另外在生成式AI和HPC等需要更高性能带宽的尖端领域,也有了广阔前景。这就意味着,GDDR7突破了以往的性能瓶颈,开始有了能与低端HBM相媲美的性能表现。
这让GDDR有能力实现破圈:从To C的消费级GPU应用,迈向To B的企业级高性能市场。
据美光官方信息,在游戏领域,美光的GDDR7样品预计每秒帧数(FPS)提升幅度超过30%,特别是光线追踪和光栅化工作负载。
生成式AI方面,美光GDDR7提供超过1.5TB/s的高系统带宽,预计可将生成式AI文本到图像生成的响应时间加快20%;在HPC,GDDR7预计能减少更多处理时间,实现复杂工作负载(如动画、3D设计、科学仿真和金融建模)的无缝多任务处理。
当然,GDDR7性能提升幅度虽然相比GDDR6更高,但依然无法与HBM3/3e相比,更遑论HBM4,但GDDR7提升后的整体性能,与HBM2或许可以等量齐观。
三星电子在3月的英伟达GTC大会上也披露了其GDDR7的部分技术参数,比如三星GDDR7能在仅1.1V的DRAM电压下实现32 Gbps的速度(与GDDR6X相比提升33%),超过了JEDEC的GDDR7技术规范的1.2V电压标准。这项性能主要是通过首次应用PAM3信号实现的。
同时,三星GDDR7能实现最高192GB/s的显存速度,单颗显存容量2GB;通过加持三星电子特有的其他电源管理创新,三星GDDR7能效提高幅度提升了20%,发热量(热阻)减少70%,待机功耗降低50%。
作为存储三巨头之一,SK海力士自然也不会缺席。海力士GDDR7最大带宽达到160GB/s,是其上一代产品(GDDR6位80GB/s)的两倍,功耗效率提升40%;内存密度提升1.5倍,故而视觉效果也进一步得到增强。
目前,海力士16Gb GDDR7预计将在今年三四季度实现批量出货,三星也在出样品的过程中;美光GDDR7内存将于今年下半年发售。意外的是AMD,据美光透露,AMD也会加入GDDR7市场角逐。