6月18日全球GPU龙头英伟达成为全球市值最大的公司
2024年6月18日美股收盘,英伟达市值达到3.33万亿美元,超过微软、苹果、谷歌、亚马逊成为全球市值最大的公司。
人工智能对GPU算力需求,是GPU的最大推动力
以英伟达为例,足见算力对GPU的拉动力。2024年Q1收入占比高达86.6%的数据中心业务,收入增长426%达到225亿美元。而在2016年英伟达的数据中心业务收入占比仅有6.77%。
拐点一:AI竞赛放缓,大模型创业公司倒闭退出
5月6日幻方的深度求索率先发起价格战,后续阿里、百度、腾讯、字节等旗下大模型跟进。目前大模型的主流应用还停留在问答模式,降价的背景是盈利模式无法很好落地,只能通过tokens收费。大模型创业公司若不改变无法盈利或看不到盈利预期的烧钱模式,未来就会有现金流中断的风险,大批量创业公司退出将会减少对GPU需求。
拐点二:三星投资GPU,新竞争者加入拉低行业利润率
行业龙头英伟达24Q1毛利率高达78.35%,净利润率57%,高利润率容易吸引更多的竞争者加入。三星公开宣布投资GPU,预示着与GPU行业巨头英伟达正面竞争。与谷歌等互联网大厂以fabless模式做GPU不同,三星做GPU有经验与技术积累:1.三星的半导体业务是IDM模式,设计与工艺紧密融合。2.三星拥有Exynos等处理器的成功经验,为GPU提供算力芯片设计参考。3.三星具有与GPU配套的高带宽内存芯片(HBM),可以从系统层面提升芯片算力组的能力。
拐点三:算法层的突变,从矩阵计算到无矩阵计算
通过算法的改进,减少对GPU的消耗,是技术层面的重大风险。前面两大风险都是中短期对GPU公司业绩的影响,是在原有的技术框架下的竞争。而算法技术层面的突变是较大的变革,如同从燃油车到电动车,对汽油的需求直接清零。矩阵乘法(MatMul)是Transformer大语言模型(LLM)中最耗费计算资源的运算,矩阵乘法占用了高昂的计算成本和庞大的内存需求。2024年6月18日arXiv的论文《ScalableMatMul-freeLanguageModeling》(第五版)中的新Transformer架构通过无矩阵乘法(MatMul-free),显著减少对GPU和内存依赖,并且使用FPGA方案替代GPU进行训练和推理,以13瓦特的功耗处理数十亿参数模型,已接近人脑效率。
本文作者:何立中(SAC执证编号:S0110522110002),来源:首创证券,原文标题:《GPU的拐点》