赛道Hyper | 三星欲拔CXL市场头筹能如愿否?

战事激烈,优势微弱。

作者:周源/华尔街见闻

GenAI(生成式人工智能:Generative Artificial Intelligence)应用的飞速发展,在推升英伟达超越三星电子成为全球第二大半导体(营收)厂商的同时,也让为英伟达AI加速卡提供HBM(高带宽存储器:High Bandwidth Memory)的SK海力士赚得钵满盆满。

得益于2021年对HBM未来市场潜力的正确预判,海力士如今在HBM市场叱咤风云,销量市占率为全球第一且相比排名第二的三星电子而言,做到了名副其实的“遥遥领先”。

三星电子意识到在HBM市场落后于海力士之后,发动战术反攻,希望抢回被海力士占据的全球第一宝座。

三星电子在GenAI领域的战术手段包括两个方向:第一,开发Mach系列(目前正研发1,规划研发2),挖英伟达墙角;第二,推动CXL(Compute Express Link)内存标准研发,为英伟达和自己家Mach系列在实现高存储容量的同时,也能提升数据传输速率。

海力士领先:三星对策?

英伟达是HBM的全球最大买家,这种超级“芯片”已成为AI图形处理单元的关键组件。SK海力士是英伟达当前代际存储芯片HBM3和HBM3E的唯一供应商。在HBM3E全球市场,海力士市占率介于75%-80%之间。

SK海力士已开始批量生产其下一代芯片HBM3E(第六代际),美光科技(Micron)也加入了这一行列。此前不久,这两家公司都已宣布其HBM3E今年所有产能都被英伟达预订一空。与此相比,三星供应英伟达的HBM3E目前尚处于资格测试阶段。

HBM是一种由多个DRAM芯片堆叠而成的芯片立体芯片组。这些DRAM芯片通过硅通孔(TSV)的微细导线在垂直堆叠层之间实现相互连接。2014年首款HBM芯片问世。

HBM芯片容量从1GB升级至24GB,带宽从128GB/s提升至819GB/s,数据传输速率也从1Gbps提高至6.4Gbps。

由于提升芯片有限面积上的晶体管数量难度增加,为了维持摩尔定律的有效性,故而将堆叠作为一种技术而非扩展以推动各种芯片(也包括3D NAND)性能超越极限的策略,在2010年开始为业界推重。

截至2024年3月,全球能稳定供应HBM3产品的供应商是韩国SK海力士、三星电子和美光科技。其中,海力士和美光科技能稳定供应HBM3E。

三星电子在2020年前,原本是这种技术的领导者。2015年,三星电子全球首发HBM2芯片;2021年,海力士后来居上,成为全球首家能提供HBM3的厂商。此后,2019年,三星电子解散HBM业务和技术团队。海力士抓住机会,顺势成为HBM全球霸主。

2022年11月30日,ChatGPT横空出世,HBM成为英伟达AI加速卡最重要的高带宽内存芯片。当年全球50%的HBM出货来自SK海力士,三星占比40%,美光占10%。

但在HMB3E细分市场,海力士全球市占率高达75%-80%,而三星电子尚未有资格为英伟达供应这个代际的HBM3E芯片。

由此,海力士取得了战略层面的重大胜利。

三星电子反应极大:今年1月和3月,三星电子先后成立两个HBM技术团队;3月19日,在全球芯片制造商Memcon 2024会上,三星副总裁兼DRAM产品和技术主管Hwang Sang-joong透露,三星电子将批量大规模生产12层第五代HBM(即HBM3E)。

同时,Hwang Sang-joong公布了HMB技术路线图,预计2026年HBM出货量将是2023年产量的13.8倍。到2028年,HBM年产量将进一步增至2023年水平的23.1倍。

根据三星电子的HBM技术路线图,2026年三星电子的主力HBM产品应该是第五代HBM3E和第六代HBM4。其中,前者将大幅提高堆叠数量。三星在会上展示HBM3E 12H芯片——业界首款12层堆栈的HBM3E,这标志着HBM技术有史以来实现了最高容量的突破。

公开消息显示,三星电子正在向英伟达提供HBM3E 12H芯片样品,计划在2024年上半年开始量产。

不仅如此,作为全球半导体产业链最长、最全的三星电子,在GenAI市场的战术反攻,目标对象不仅只想拉海力士下马,同时也将竞争压力迫向英伟达,但实现路径较为间接。

三星半导体业务负责人Kyung Kye-hyun在3月下旬表示,三星正在开发下一代AI芯片Mach-1,目的是分英伟达的AI加速卡蛋糕。

据三星介绍,Mach-1是一种片上系统(SoC)形式的AI加速卡,能减少图形处理单元(GPU)和HBM之间的数据传播速率瓶颈。这款技术产品为英伟达下游采购商韩国搜索巨头Naver采用,合同规模高达7.52亿美元。

CXL市场:鹿死谁手未可知

鉴于三星电子在HBM战略层面的落后,只能靠技术代际超越夺回海力士全球第一的宝座。

三星电子的杀手锏,就是CXL技术。

在Memcon 2024会上,三星执行副总裁Han Jin-man披露了三星CXL技术和愿景。

CXL技术是一种高速、大容量中央处理器(CPU)到设备以及CPU到内存连接的开放标准,专为高性能数据中心计算机而设计。

鉴于CXL技术原理较为复杂(与PCIe<Peripheral Component Interconnect Express>技术有关),故而只谈CXL的作用:采用CXL技术的内存,在实现高存储容量时,能克服常见DIMM内存的性能和插槽封装限制。应用方面,涉及软硬件两个层面——服务器和存储产品与解决方案。

2023年初,AMD发布的第四代EPYC(代号Genoa)和英特尔发布的第四代Xeon Scalable(代号Sapphire Rapids)处理器平台,构建了CXL的应用硬件端,还包括三星、海力士、美光,Astera Labs和中国台湾的世迈科技(SMART Modular Technologies)等等;软件层面主要是一些云服务和软件系统应用公司,比如Elastics.cloud、英国IntelliProp、以色列UnifabriX之类。

其中,三星电子是推动CXL技术应用的急先锋。

2021年5月11日,三星宣布推出业界首款支持CXL互连标准的内存模块(基于128 GB DDR5)。这个模块与三星DDR5技术实现集成后,能显著扩展服务器系统的内存容量到TB级和带宽,从而加速数据中心(IDC)的AI和高性能计算(HPC)的工作负载。

三星这款CXL内存模块,还整合了多种控制器和软件技术,如内存映射、接口转换和错误管理,这将使CPU或GPU能够识别基于CXL的内存并将之用作主内存。

此后,三星又发布全球首款配备512GB DDR5 DRAM的CXL内存模块,相比上一代,这款内存模块的容量提升4倍,延迟减少20%。

2023年5月12日,三星宣布成功开发业界首款支持CXL 2.0的128 GB DRAM,支持PCle 5.0接口(x8通道)并提供高达每秒35GB的带宽。这款产品最终在英特尔至强平台上实现了里程碑式的应用。

与HBM相比,CXL不但也解决带宽问题,还同时搞定了容量扩展问题。就像堆叠(Chiplet)技术解决了在有限面积上的晶体管数量瓶颈。

总的来说,符合CXL技术的内存,具有高带宽、低延迟和可扩展三大特性。因此,尽管HBM现在仍是主角,但未来无法扩展将成为其发展前景的制约。

事实上,SK海力士与美光也看到了CXL的潜力,但这两家公司在这项技术上的进度,与三星相比,尚有不足。与三星相比,海力士在2023年9月展示了首款CXL 2.0产品,落后三星约四个月,美光则比海力士早两个月,但也同样落后三星两个月。

三星想通过CXL技术超越海力士,就目前看来,领先优势较为微弱,究竟在这块新市场,谁才是霸主,现在还很难说。

风险提示及免责条款
市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。