作者:周源/华尔街见闻
1月27日,英伟达美股盘前深度下跌,幅度超过12%(截至北京时间1月27日20:24),跌破了2024年12月17盘中的126.86美元低点。
黄仁勋恐怕做梦也没想到,撼动英伟达产业逻辑的,居然是一家中国私募。
1月20日,管理基金规模超过1000亿元的中国顶级私募——幻方量化,旗下公司“深度求索”(DeepSeek)推出的推理大模型DeepSeek-R1(以下简称DS-R1),以超越行业认知的超低训练成本和不亚于OpenAI o1正式版的性能(数学、代码、自然语言推理等),震撼了美国硅谷。
这个GenAI推理大模型的问世,实际上相当于中国技术问鼎全球第一梯队的宣言。从此,中国在尖端技术领域,将从追赶者,转变为有范式制定的实力。
这是GenAI时代真正的开始,而揭幕者,第一次是中国技术公司。
但就未来而言,英伟达产业逻辑,未必如眼下的英伟达巨幅滑落的股价那样,反而很可能会得以进一步强化。
此话如何理解?
DS-R1“秒破”英伟达价值链
1月24日,在大模型排名Arena上,DS-R1基准测试升至全类别大模型第三。
其中,在风格控制类模型(StyleCtrl)分类中,DS-R1与OpenAI o1并列第一,竞技场得分达到1357分,略超OpenAI o1的1352分。
OpenAI o1是OpenAI在2024年9月12日正式对外发布的一款新模型,是OpenAI下一代 “推理”模型中的首个产品。
DS-R1实现与OpenAI o1几乎无差别的性能表现(部分开源小模型性能甚至超越了o1),成本竟只有后者的3%-5%(约550万美元)。
这颠覆了人们对实现尖端AI性能所需条件的既有认知,顺带把英伟达价值链条在瞬间干成了碎片。
目前,OpenAI o1推出的ChatGPT Pro计划,月费高达200美元(约合人民币1440元,合计年费17280元人民币),对ChatGPT Plus或Team帐户每周有50次的访问限制。
若通过API使用o1预览版,则输入每百万token收费15美元(约合人民币108元),输出每百万收费60美元(约合人民币432元)。
花费约1.7万元人民币,每年只能问约2600次?
这种应用成本,非一般人能承受。
再看看ChatGPT-4o,个人版月费约20美元(约合人民币145元,合计年费1740元人民币),也有提问次数限制。
相比之下,DS-R1个人版使用免费;另据官方消息披露,DS-R1 API服务定价为输入每百万token收费人民币1元(缓存命中)或4元(缓存未命中),输出每百万token收费人民币16元。
全世界人民都爱低成本但性能优异的应用,看着如此悬殊的价格差,美国人民也做出了自己的选择:目前,DS-R1已飙升至HuggingFace上下载量最高的热门GenAI模型。
DS-R1在苹果商店(AppStore)美区免费榜排名第四,超越Google Gemini和Microsoft Copilot等美国GenAI应用。
在技术迭代方面,DS-R1为全开源模式,因而开发者和研究人员能更广泛地参与其中,集合全球的科技力量,推动生态技术创新和促进市场良性竞争;OpenAI o1则是闭源模式,只能依靠OpenAI团队努力,并在此基础上,形成对英伟达产业逻辑的超强支撑。
可以预见,没有达到DS-R1性能的闭源模型公司,将大批量倒闭(若不想倒闭,那就加入DS-R1开源生态,这就叫“打不过,就加入”);即使是OpenAI,其闭源API的价值,也将重构。
现在,DS-R1的强悍性能、低成本特性和开源模式,让全球有志于参与GenAI生态的商业组织和个人,能大规模推动生态应用的广度和深度。
可以说,DS-R1将成为GenAI生态应用的催化剂,真正让世界进入GenAI应用时代。只不过这次,全新的GenAI时代的市场推动力,首次有了中国公司的身影。
在既有的认知中,中国公司虽能大幅降低产品成本,但技术却做不到领先全球,这次深度求索推出的DS-R1,打破了“虽然便宜但技术含量不足”的旧模式,首次取得全新技术时代核心推力俱乐部门票。
中国技术力量在GenAI技术浪潮中,表现靓丽。深度求索,不是一个人在战斗。
此前,火遍业界的豆包大模型,也推出迭代版。
据豆包微信公众号消息,1月22日,豆包大模型1.5Pro版本正式发布。
这款大模型在知识、代码、推理和中文等多项公开测评基准上成绩领先全球,综合得分优于GPT-4o、Claude3.5和Sonnet等硅谷一流模型。
英伟达逻辑结束了?
DS-R1的出品公司深度求索,为创业型公司,并没有上市。
但在1月27日,参与深度求索天使轮和Pre-A轮融资机构背后的上市公司,开盘即“一字板”涨停。
公开资料显示,杭州东方嘉富基金参与深度求索天使轮投资。杭州东方嘉富基金隶属“浙江东方”旗下;而参与深度求索Pre-A轮融资的华金领越基金,背后上市公司是“华金资本”。
这两个公司,在1月27日A股开盘即告涨停。
但为深度求索提供基础算力支持和基础设施的浪潮信息和中科曙光,以及与深度求索有产品技术合作的像拓尔思,因市场仍在构建逻辑过程中,涨跌就有了分化。
简单说下浪潮信息和中科曙光与深度求索的合作方向,前者为深度求索提供AI服务器集群(英伟达H800),后者承建深度求索杭州训练中心液冷系统。
与DS-R1概念有关的A股公司,此次却不是映射,而是直接有实际相关性。
有映射关系的,这次是英伟达产业逻辑。
DS-R1低成本实现强悍性能的本质在于提高了算力利用率,而非从此不需要算力或者对算力的需求减弱。
深度求索(DeepSeek)推出性能如此强悍的DS-R1,会让业界看到,提升算力效率是现实的,能实现的;在吸收深度求索提升算力效率的思想和方法后,业界会加码算力规模,以实现更大利益的达成。
因此,DS-R1并没有敲响英伟达产业逻辑的丧钟,相反,这实际进一步夯实了“达链”在二级市场统治力的基础。
可以用一个公式概括:
DeepSeek提升算力效率的方法+更大规模的算力=没有天花板限制的利益
低成本、强性能的DS-R1,会高度促进GenAI应用生态的繁荣速度。
从这个角度上看,海量开发者和应用方(包括B端商业组织和C端个体)的参与,会更进一步提升对算力供应商的需求。
这就像智能手机开源系统安卓加入手机应用生态后,对手机的移动SoC芯片和存储芯片的性能需求大幅度提升一样。
在2024年12月,深度求索推出DS-V3时,有评论认为:DeepSeek-V3将支持私有部署和自主微调,为下游应用提供远大于闭源模型时代的发展空间。未来一两年,大概率将见证更丰富的推理芯片产品、更繁荣的LLM应用生态。
在人类发展史上,无论是哪个技术时代,最终都为了一个目标,或者说,只有实现这个目标,技术时代才有真正的推动力。
这个目标,就是利益。
商业价值,就本质而言,只是为了到达利益彼岸的桥梁。
GenAI技术也不例外。
硅谷在过去的两年中(以2022年11月30日OpenAI推出ChatGPT-3.5为时间基准),投入的上千亿美元资本开支,也不是为了实现“利他”理想,而是为了利益——共赢不是否认利益,而是利益均沾。
从2007年史蒂夫·乔布斯推出初代iPhone至今,当真正催生繁荣的应用生态后,超越想象的巨大利益,才能滚滚而来。
因此,DS-R1,真正的价值,在于让全球GenAI的参与方,先看到、再学会如何用更低成本提升算力利用效率。
在DS-R1或DS-V3推出之前,原本花上1元钱得到的算力,形成的性能,达成了1.5元的收益,现在只要花0.1元,就能得到与之前投入1元相同的性能,实现相同的收益。
这时,你会怎么做?
是决定停止投入,还是选择加大力度?
如何选择,不言而喻。
因此,英伟达和A股“达链”(比如铜缆连接)板块股价这次大幅下挫,若是巨“坑”,也闪耀着某种稀有金属的色泽。