AI热潮方兴未艾,让英伟达成为当仁不让的霸主,该公司的GPU已成为各种规模的AI公司首选的芯片。然而,媒体报道,成立于去年年底的公司TensorWave正在逆流而上,推出了一个仅提供英伟达竞争对手AMD硬件的云服务,处理AI工作负载。
TensorWave的首席执行官兼联合创始人Darrick Horton在接受TechCrunch采访时表示:
“我们意识到这是一个不健康的垄断现象,这是一个导致最终用户无法获得计算资源并抑制AI领域创新的现象。出于我们希望AI大众化的愿望,我们决定提供一个可行的替代方案,恢复竞争和选择权。”
落户赌城
根据报道,Horton与TensorWave的其他两位联合创始人Jeff Tatarchuk和Piotr Tomasik是通过Pickleball运动认识的,随后就GPU算力的垄断导致供应限制的问题达成共识,最终促使TensorWave。
TensorWave总部位于拉斯维加斯,对于一家云基础设施初创公司来说,这是一个不寻常的选择。但Horton表示,团队看中了这个机会。“我们认为拉斯维加斯有潜力成为一个蓬勃发展的技术和初创公司生态系统。”
这个预测并非完全脱离现实。根据Dealroom.co的数据,拉斯维加斯拥有600多家初创公司,雇佣了11,000多名员工,并在2022年吸引了超过40亿美元的投资。
与许多美国主要城市相比,拉斯维加斯的能源成本和运营费用也较低。此外,Tomasik和Tatarchuk与当地的风险投资社区有着紧密的联系。
Tomasik之前曾是总部位于拉斯维加斯的种子基金1864 Fund的普通合伙人,现在与非营利加速器StartUp Vegas和Vegas Tech Ventures合作。Tatarchuk是孵化器机构Fruition Lab的天使投资人。
这些联系帮助TensorWave成为了市场上首批提供AMD Instinct MI300X实例处理AI工作负载的云服务之一。TensorWave提供按小时租用GPU计算资源的服务,并要求至少六个月的合同期限。
以AMD为中心
媒体报道,目前低成本、按需服务的GPU云市场正在蓬勃发展。而Horton表示,TensorWave的竞争优势明显。
首先是价格。Horton指出,AMD MI300X的价格比当前最受欢迎的英伟达GPU H100便宜得多,这使得TensorWave能够将节省的成本传递给客户。他没有透露TensorWave的具体实例定价,但如果想要打败H100,定价必须低于2.50美元/小时。
其次是性能。Horton引用了基准测试数据,显示MI300X 在运行(但不是训练)AI模型方面优于H100,尤其是在像Meta的Llama 2这样的文本生成模型上。
除了TensorWave,其他押注AMD AI芯片的公司包括初创公司Lamini和Nscale,以及更大型、根基更深厚的云供应商,如Azure 和Oracle。
分析认为,当前对AMD芯片使用者的有利因素是英伟达GPU持续短缺,以及英伟达即将推出的Blackwell芯片的延迟。不过,随着关键芯片组件(特别是内存)的制造加速,短缺可能很快会缓解。这将使英伟达能够加大H200的出货量,这款新品的性能得到了显著提升。
对于依赖AMD硬件的新兴云服务商来说,另一个存在的挑战是如何跨越英伟达围绕AI芯片构建的竞争壁垒。业界普遍认为,英伟达的开发软件更为成熟且更易于使用,并且已被广泛部署。甚至AMD首席执行官苏姿丰也承认,采用AMD芯片“需要付出努力”。
更远的前景来看,随着超大规模公司增加对定制硬件的投资,专注于价格竞争的挑战可能会日益艰难。例如,Google提供其TPU;微软最近推出了两个定制芯片Azure Maia和Azure Cobalt;而亚马逊AWS拥有Trainium、Inferentia和Graviton。
但Horton表示:
“随着开发人员寻求能够有效处理其AI工作负载的替代方案,尤其是在内存和性能需求增加的情况下,加上生产问题导致的延误,AMD将在未来更长时间内保持领先地位,并在AI时代的计算大众化中发挥关键作用。”
预计年底经常性收入增长8倍 估值已达1亿美元
TensorWave目前已有300万美元的年经常性收入。Horton表示,一旦TensorWave将其MI300X的容量提高到20000个,预计到经常性收入年底将达到2500万美元,增长8倍。
假设每个GPU的成本为15000美元,那么20000个MI300X将意味着一笔3亿美元的投资,然而Horton声称,TensorWave的资金消耗率“完全在可持续水平内”。TensorWave此前曾表示,将使用其GPU作为大规模债务融资的抵押品,这是其他数据中心运营商采用的一种方法,Horton 表示这仍然是该公司计划的一部分。
他继续说道:
“这反映了我们强劲的财务健康状况。我们通过在最需要的地方提供价值,战略性地定位自己,以应对潜在的逆风。”
不过,当被问道TensorWave目前有多少客户时,Horton由于“保密原因”拒绝回答,但强调了TensorWave已公开宣布的与网络骨干供应商Edgecore Networks和由前Neuralink工程师创立的AI推理初创公司MK1的合作伙伴关系。
Horton表示,该公司正在迅速扩大算力,以满足日益增长的需求。他还补充道,TensorWave计划在今年年底开始使用的AMD可能在四季度推出的下一代MI325X GPU。
投资者对TensorWave的增长轨迹表示满意。Nexus VP在周三透露,该机构领投了一轮4300万美元的融资,参与者还包括Maverick Capital、StartupNV、Translink Capital和AMD Ventures。这是TensorWave的第一轮融资,融资后该公司的估值达到1亿美元。