老黄超200亿美元的推理闭环成型了

量子位
平安夜刚砸200亿把Groq的“TPU之父”团队打包带走;转头又瞄准AI21 Labs,斥20-30亿美金将其收入麾下,还带走了AI21背后的200名顶尖AI博士。加之9月份9亿美元买下的Enfabrica,收购3连招之后,英伟达算是把“硬件-网络-架构”这条链子拉闭环了。

财大气粗的老黄7天内接连收购Groq、AI21 Labs,总投入超200亿美元。

平安夜刚砸200亿把Groq的“TPU之父”团队打包带走;

转头又瞄准AI21 Labs,斥20-30亿美金将其收入麾下,还带走了AI21背后的200名顶尖AI博士。

而且,加之9月份9亿美元买下的Enfabrica,收购3连招之后,英伟达算是把“硬件-网络-架构”这条链子拉闭环了。

AI21和Groq更适配

英伟达在AI训练市场的份额早已超过90%,但推理市场却是另一番景象:

定制ASIC芯片抢占了37%部署份额,谷歌、博通等巨头虎视眈眈,市场正变得越来越分散。

黄仁勋显然不想在这场新较量中落后——抢人才就成了最直接的破局方式。

前几天的Groq,不仅拿走了LPU,也带走了公司90%的员工。

最新瞄准的AI21,表面看是一家估值14亿美金的以色列初创公司,实则又是个“博士天团聚集地”。

三位创始人是科技圈顶流配置。

董事长Amnon Shashua是希伯来大学讲席教授,手里握着140多项专利,1999年创办的Mobileye后来以153亿美元卖给英特尔,让他直接跻身以色列前20富豪;

联合CEO Ori Goshen是连续创业者,前两家公司不是被收购就是成了行业标杆;

还有斯坦福荣誉退休教授Yoav Shoham,曾是谷歌首席科学家,创业项目多次被巨头打包带走。

这群大佬带领的200多位博士,手里还握着Jamba混合架构这张王牌。

现在,英伟达拥有了这个天团,于是事情就变得有趣了。

此前收购的Groq,它们的LPU使用的并不是HBM,而是速度极快,但内存受限的SRAM。

纯Transformer模型在这上面表现不佳,因为KV缓存会随着上下文长度爆炸式增长。

而AI21博士天团手里的Jamba架构正是Groq这类内存受限的推理硅片所需要的。

Jamba采用Mamba-Transformer混搭设计,长文本处理速度比同类模型快2.5倍,相比DeepSeek、Llama、谷歌效率提升2-5倍,还能在256K上下文里轻松跑起4GBKV缓存。

收了Groq的LPU和核心团队;拿下AI21,又把200个博士收入麾下,还能直接补上推理架构的短板。

英伟达正式开始了对谷歌TPU冲击的回应……

三重收购组合拳

回头再看三重收购的组合拳,每一步都被老黄算得精准。

之前9亿美元带走了Enfabrica和CEO Rochan Sankar及其核心团队,补上了网络技术,解决数据传输的卡脖子问题。

前几天收购Groq的时候,拿技术又得人心。

不仅将推理硅握在手里,连带着“TPU之父”Jonathan Ross领衔的核心团队一起,将90%的员工打包转入英伟达。

而且人均套现500万美元,连工作不满一年的员工都被取消了“悬崖期”,老黄这波操作也算得上良心。

AI21负责LLM架构,把算力转化成能落地的商业解决方案。

三者一结合,英伟达在推理市场的“硬件-网络-架构”闭环直接成型。

以前大家还在猜“GPU会不会被挤出推理赛道”,现在老黄用200多亿美金给出了答案——

不仅要守住,还要通过垂直整合把优势拉满。

谷歌已经用TPU证明,GPU不是AI推理的唯一解,而老黄这波操作,就是要通过人才和技术的双重布局,对抗谷歌、博通的威胁。

三重收购、200个博士背后,是能让推理效率翻倍的技术,也是能对抗谷歌、博通的底气。

本文来源:量子位

风险提示及免责条款
市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。
相关文章