2月18日中午, 马斯克旗下XAI举行Grok 3发布会,超过100万人在线观看,马斯克称赞其为“地球上最聪明的人工智能”。
发布会演示显示,在数学推理、科学逻辑推理等多方面的性能表现上,Grok3和Grok-3 mini都超过或媲美Gemini、DeepSeek和ChatGPT等对手,此外xAI还推出功能更为强大的Grok3 Thinking推理模式。
除了计算能力方面,在理解力和创造力方面,Grok3表现同样出色。演示包括实时解决复杂的物理问题,例如绘制行星际轨迹,构思视频游戏......
更惊喜的是,马斯克透露,Grok-3最佳体验“大约一周之后”,语音交互功能还在开发中,一周后用户就可以拥有对话体验。
马斯克在发布会中表示,X上的Premium Plus用户开始,将是首批获得访问权限的群体,同时用户也可以通过Super Grok单独订阅服务。
此外,为了支持Grok3训练,xAI在短短三个月将数据中心训练集群翻倍20万块GPU,并且xAI与戴尔达成50亿美元协议,戴尔或将今年向xAI交付搭载英伟达GB200芯片的服务器。
“地球上最聪明的AI”
据介绍,在数学推理、科学逻辑推理和代码写作等能力表现方面,Grok-3在多项benchmark测试中均取得了比DeepSeek-v3、GPT-4o、Gemini-2 pro更优的效果。据悉,目前Grok 3已经在xAI内部运行了2周。
xAI工程师介绍,虽然Grok起步较晚,但在MMLU得分上以超快地速度追上了ChatGPT。
马斯克及其团队表示,Grok 3也将具有类似DeepSeek R1和OpenAI o3 Mini的推理能力。
马斯克团队指出,大约一个月前,Grok 3的预训练已经完成,从那时起其一直在努力将推理能力融入Grok 3模型中。Grok 3推理迷你版的训练时间更长,表现略优于Grok 3推理模型,这表明Grok 3推理模型具有巨大的潜力。
从各项指标来看grok 3一举超越所有模型,排名世界第一,有推理模式,有deep research功能。上周,马斯克在迪拜世界政府峰会的视频通话中宣布了 Grok 3 的推出,并称该聊天机器人具有“非常强大的推理能力”并且是“地球上最聪明的人工智能”。
Grok 3比 Grok 2 快十倍,在Grok3中大规模安装更多计算能力使其能够在更短的时间内运行大数据集,同时提供更高的准确性。
具体演示来看,Grok3现场为太空发射生成动画3D图,展现了其理解复杂物理知识的能力。
马斯克团队输入提示要求要求Grok-3现场生成代码,运行代码后画面上显示出了飞船在地球和火星间往返的动画。
另一段演示中,Gork-3制作一款类似于俄罗斯方块和宝石迷阵的游戏,展现了其出色的创造力。
马斯克还透露称,我们将在xAI 推出一个人工智能游戏工作室。如果你有兴趣加入我们并开发人工智能驱动的游戏,请加入我们。
xAI通过修改 Grok3的训练过程(而不仅仅是硬件改进)为Grok3实现了更好的功能。更新后的模型实现了合成数据集、自我校正和强化学习,以提高其性能。
订阅试用方面,马斯克表示,Grok3 测试版现已面向X Premium 用户开放,并且推出 SuperGrok订阅服务。
此外,xAI计划在最新版本完全成熟后立即开源其Grok 模型的先前版本,马斯克预计Grok-3的过渡将在几个月内完成。
xAI与戴尔达成50亿美元协议,三个月将数据中心容量翻倍
值得一提的是,xAI即将与戴尔科技达成协议收购价值超过50亿美元的配备英伟达GB200芯片的AI优化服务器,旨在满足Grok 3和其他AI应用程序日益增长的计算需求。
见闻此前文章指出,知情者称,若达成交易,戴尔将今年向xAI交付搭载英伟达GB200芯片的服务器,用于优化AI工作。
在发布会上,马斯克团队还透露,xAI在短短三个月将数据中心容量翻倍,使用了20万个英伟达H100 GPU打造出最佳AI。
马斯克团队表示,去年4月马斯克决定xAI要想取得成功并打造出最佳 AI,唯一的办法就是创建自己的数据中心。我们花了122天的时间才让第一批10万个GPU启动并运行。我们很快意识到要构建我们设想的 AI,需要将集群规模扩大一倍。因此启动了另一个阶段,我们在短短92天内就将容量翻了一番。
网友热评:有史以来第一个突破1400分的模型、性价比超Gemini
网友们对于Gork-3的发布也满怀激动,AI大佬Andrej Karpathy试用后称赞说,Grok3+Thinking大概和 OpenAI 最强的模型(比如 o1-pro,月费 200 美元)相当,比 DeepSeek-R1和 Gemini 2.0 Flash Thinking 略好一些。
还有网友夸赞称,Grok-3是有史以来第一个Chatbot Arena突破1400分的模型,其性能优于 OpenAI 和 Google 的最佳公开推理模型。而xAI 成立于 Deepmind晚13年,比OpenAI晚8年,现在领先于两者。
有网友则对AI信心十足,Grok3似乎非常强大,这很好地证明了缩放定律实际上并没有结束,非常看好人工智能的未来。
也有网友指出了其缺点,Grok3 不擅长编码。
此外,更有网友猜测,这会不会激起一轮大模型价格战呢?