本文作者:李笑寅
来源:硬AI
据媒体报道,芯片巨头英伟达正接近达成一项收购GPU租赁商Lepton AI的交易,交易金额预计达数亿美元。
在算力需求被质疑之际,英伟达这一收购举动是进军云计算领域的重要一环,标志着其与亚马逊和谷歌等主要云提供商的直接竞争。
Lepton AI:一家GPU“二房东”
Lepton AI成立于2023年,总部位于美国加利福尼亚州帕洛阿托,是一家提供GPU算力租赁服务的初创公司。
此前,Lepton曾为游戏初创公司Latitude.io和科研初创公司SciSpace提供AI云服务,其联合创始办人Yangqing Jia和Junjie Bai曾是Meta的AI研究人员。
与普通云服务提供商不同,Lepton不自行管理数据中心或服务器,而是从云提供商租用后再转租给自己的客户——公司实际上不拥有任何GPU。
分析称,Lepton这种业务模式将更专注于满足AI训练和推理的特定需求,提供优化的GPU集群和相关技术服务。对公司而言,这种轻资产模式也使Lepton避开重资产投资的财务压力。
在训练方面,Lepton提供了类似Slurm的作业提交方法。实际测试表明,用户只需几分钟就能将现有sbatch脚本调整为在Lepton平台上工作,转换过程相当直观。
Lepton平台的另一大亮点在于其可视化能力。
分析称,Lepton提供控制台仪表盘,用户可以在其中查看节点生命周期,了解每个节点的作业状态。这一节点生命周期可视化功能表现出色,仅次于CoreWeave。这对于监控和管理GPU资源至关重要,能够帮助用户及时发现和解决问题。
算力租赁市场:从卖方转向买方
当前,算力租赁市场正经历深刻变革。
美国知名半导体研究机构SemiAnalysis分析指出,计算成本正随时间推移而下降,算力租赁市场已转变为明显的买方市场——现在有超过100家GPU云服务提供商在争夺基本相同的客户群体,导致价格竞争加剧。
黄仁勋也在上周的GTC演讲中发表了类似的观点:
“当Blackwell开始大规模出货时,即使是Hopper也将无人问津。”
导致这种现象的关键在于,算力市场的成本由每类GPU的成本加权平均值决定。这意味着,具有更低计算成本的系统可用性一旦增加,将推动整体计算成本下降,进而也会拉低旧卡的租赁价格。
举例来说,英伟达GB200在推理方面的单位成本(每百万个token的美元成本)比H100低75%,在训练方面的成本(每小时每个有效PFLOP的美元成本)低56%。
这意味着,如果H100想要保持竞争力,就不得不大幅降价。SemiAnalysis通过计算得出,为了让客户在使用两种芯片时感觉“无差别”,H100的每小时租赁价格需要比GB200低65%。
更直观地说,如果GB200的租赁价格为每块GPU 2.20美元/小时,那么H100的租赁价格则需要降至每块GPU 0.98美元/小时。
SemiAnalysis曾在去年预测,随着H100生产的加速,GPU价格将持续下行,并且考虑到买家将把重心转移到Blackwell战略上,这种下降趋势一直持续到2024年末。
现实证明,其预测是准确的。
这种竞争格局使得像Lepton这样的专业GPU租赁商面临巨大压力,也促使英伟达考虑通过收购来整合市场,进一步巩固其在AI计算基础设施领域的主导地位。
英伟达的野心藏不住,激进扩张云服务
英伟达CEO Jensen Huang被SemiAnalysis称为“首席营收破坏者”,这一称号反映了英伟达近年来在计算市场的激进扩张策略。
SemiAnalysis指出,通过收购Lepton,英伟达不仅获得了额外的收入来源,还可能挤压其他云服务提供商的生存空间。
进一步说,这种垂直整合策略让英伟达能够从芯片设计到算力租赁的全产业链中获利,同时还能更好地控制其GPU芯片的使用方式和价格策略,进一步增强其在AI计算领域的主导地位。
目前,英伟达的云和软件业务目前仍处于起步阶段,其模式是英伟达直接向企业出租由其芯片驱动的服务器,并提供软件帮助公司开发AI模型和应用程序,以及管理训练AI的GPU集群。
英伟达此前曾表示,这项业务未来可能产生1500亿美元的收入——这一数字超过了英伟达或亚马逊AWS目前的年营收额。
本文来自微信公众号“硬AI”,关注更多AI前沿资讯请移步这里