马斯克曝光Grok 5!1.5万亿参数,偷师Cursor狂练编程

新智元
马斯克官宣1.5万亿参数的Grok 5完成训练,参数规模为现役模型三倍。模型训练中大量使用了Cursor编程数据,以大幅提升编程能力。结合600亿美元锁定Cursor及Grok Build编程Agent上线,马斯克在AI编程赛道的三步棋已全部落定,剑指6月与OpenAI、Anthropic等巨头的正面交锋。

马斯克的编程三板斧,一口气全亮了!

就在5月25日凌晨,马斯克在????上亲自官宣:

1.5万亿参数的Grok基座模型V9-Medium训练完成,是现役模型的整整三倍,2到3周后面向公众发布。

几乎同一时间,更劲爆的细节浮出水面——

训练过程中,xAI往模型里灌入了大量Cursor编程数据。

对此,老马直接放话,Grok的编程能力将得到大幅提升。

再加上600亿锁定Cursor、Grok Build编程Agent上线,马斯克围绕编程赛道的布局,已经全面摊牌。

1.5万亿参数,Grok 5要来了

V9-Medium是xAI内部版本代号,对应的产品名几乎可以确定就是「Grok 5」。

参数规模1.5万亿,现役v8-small(5000亿参数)的整整三倍,并且针对英伟达Blackwell架构GPU进行了专项优化。

对于现在的Grok,就连马斯克本人都嫌弃得不行——「垃圾太多了」。

V9-Medium要还的,就是这笔债。

而还债的核心手段,就藏在帖子里那句「大量Cursor数据」。

偷师Cursor:拿着答案卷复习考试

Cursor的分量不用多说。

超过67%的财富500强企业在用,2026年底预计年化收入突破60亿美元。

老黄公开表示,Cursor是他最喜欢的企业级AI服务。

用Cursor数据训练Grok V9,就相当于拿着答案卷复习考试。

只不过这场考试考的是写代码,而答案卷就是工程师们实际写代码的方式。

某种意义上这既算作弊,又恰恰是正解。

这背后的原因在于,如今LLM的瓶颈不是写基本语法,而是理解复杂工程逻辑、多文件代码库和真实的调试工作流。

而Cursor有着大量来自真实开发者与AI协同编程的完整交互记录——prompt设计、代码修改、bug调试、多文件协作。

因此,恰好能补上这个缺口。

网友Peter Kuhar干脆直接问Grok本尊「Cursor数据到底包含什么」,Grok还真答了——

高质量的真实编程交互,包括开发者的prompt、代码上下文、编辑操作和任务完成记录。

值得一提的是,除了V9的发布外,此前的v8-small(0.5T)模型将在年底前开源。

编程全家桶,齐了

回看这段时间的操作不难发现,马斯克在编程赛道上的布局是一套三连击。

第一步,600亿美元锁定Cursor。

4月21日,SpaceX宣布与Cursor达成协议,拿到了以600亿美元收购Cursor的期权。如果年底前不行使,支付100亿美元合作费。

SpaceX在声明中表示:「SpaceXAI与Cursor正在紧密合作,打造全球最好的编程和知识工作AI。」

600亿锁定一家编程工具公司,马斯克对AI编程这条赛道有多看重,不用多说了。

第二步,Cursor数据直接灌进模型。

公开代码能训出基本功,但Cursor的私域编程交互数据,才是打造编程「尖子生」的核心燃料。

第三步,Grok Build编程Agent正式上线。

5月14日,xAI发布了Grok Build——

终端级AI编程Agent,命令行运行,支持代码生成、文件编辑、依赖管理、shell命令执行。

最大卖点是最多8个子Agent并行工作。

定价是SuperGrok Heavy订阅每月300美元,前六个月促销价99美元。

值得一提的是,Grok Build原生兼容Claude Code的CLAUDE.md配置文件。

没错,xAI做的工具,原生支持竞品Claude的配置格式。

Claude Code在开发者中的地位已经是事实标准,而xAI为了降低迁移成本,愿意主动兼容对手生态。

务实,但也多少有点心酸。

至此,三步棋全部落完——收购拿分发,数据拿能力,Agent拿入口。

全部指向同一个目标:AI编程

Grok离编程王座还有多远?

把Grok放到编程赛道的坐标系里,差距一目了然。

SWE-bench Verified是目前开发者社区最关注的AI编程基准测试。

然而,与OpenAI和Anthropic相比,Grok差的是一整个身位——

  • GPT-5.5:88.7%。

  • Claude Opus 4.6:80.8%。

  • Grok 4系列:72%-75%。

更惨的是企业采用率。

Enterprise Technology Research的数据显示,截至2026年3月,企业用户中OpenAI占55%,Anthropic从一年前的20%飙升到47%,谷歌39%。而Grok只有区区的6%。

参数翻三倍加上Cursor数据,V9-Medium确实有可能带来质变。

但参数规模和能力从来不是线性关系,训练数据质量和RLHF精度往往更关键。

有分析推测,xAI可能在预训练后期就已经灌入了大量编程数据,类似Cursor Composer 2.5的heavy mid-training策略,这样post-training阶段确实可以压缩。

6月决战,四家硬碰硬

斯克选择在这个时候亮牌,时间点很微妙。

SpaceX将于6月12日在纳斯达克上市,目标估值1.75万亿美元,若成功将是史上最大IPO。收购Cursor的600亿美元交易预计在IPO后30天内完成。

V9-Medium的公开发布,恰好卡在IPO之前。

更可怕的是,这不是马斯克一个人在加速。

OpenAI的GPT-5.6已经在Codex后台泄露,代号iris-alpha,150万Token上下文窗口实测跑通。Polymarket预测6月底前发布概率超过85%。

Anthropic的Claude Opus 4.8已在Google Vertex后台现身。Sonnet 4.8跳过4.7直奔4.8。曾被称为「太危险不公开」的Mythos 1,也在Claude界面短暂露脸。

谷歌的Gemini 3.5 Pro,同样定档6月。

四家前沿实验室,同一个月,硬碰硬。这个6月,注定是2026年AI领域最惨烈的一场混战。

前沿实验室之间的差距现在已经缩到以周为单位,单次发布不再重要,节奏才是关键。

马斯克赌的就是这个节奏。

V9-Medium不需要一炮封王,它需要的是证明xAI还在牌桌上,而且手里不止一张牌。

至于那台月租12.5亿美元租给Anthropic的Colossus 1——帮对手训模型的同时,也在帮自己续命。

这场AI军备竞赛里,活着比赢更重要。

而活着的前提,是有人愿意为你的算力买单。哪怕那个人,恰好是你的对手。

本文来源:新智元

 

 

风险提示及免责条款
市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。
相关文章