AI推理基础设施市场正面临一轮显著的成本与供给冲击。
在美国知名风投机构Altimeter近期举办的活动上,AI推理基础设施服务商Baseten首席执行官Tuhin Srivastava透露,其云服务商已于今年5月提前通知,英伟达B200 GPU的每小时租赁单价将在10月合同续约时,从现行的2.63美元涨至5.10美元,涨幅约94%。
他强调,这一数字的关键不在于绝对价格水平,而在于其所折射出的供需失衡程度——云服务商提前数月主动报价,本身即表明在算力持续紧缺的背景下,需求方已几无议价空间。
与此同时,供给端紧张态势同样未见缓和。据Tuhin Srivastava介绍,当前采购1000块GPU的交付排期已普遍延至明年第二季度,等待周期长达12至15个月。交付瓶颈与租赁价格上涨形成叠加效应,企业即便加大投入,短期内亦难以通过采购途径补足算力缺口。价格上行与供给瓶颈双重挤压下,AI推理的成本正面临实质性抬升。
Baseten成立于2019年,总部位于旧金山,定位为生产级AI推理基础设施服务商,业务涵盖模型部署、管理、扩展与监控,提供多集群、多云环境的弹性扩展支持,并辅以性能研究与嵌入式AI工程服务。截至2026年1月,公司已完成D+轮融资,并获得英伟达战略投资。
Baseten首席执行官Tuhin Srivastava
风险提示及免责条款
市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。