网友提问“中国大模型何时达到Fable级别?”,马斯克“可能明年Q1”,智谱CEO唐杰“不需要那么久”

332
智谱AI发布GLM-5.2后,研究员Teortaxes判断中国模型追赶上Fable级别模型需7个月。GLM-5.2在FrontierSWE基准上得74.4分,仅落后Opus 4.8约1个百分点。国产开源模型凭借性能、成本与自主可控优势,正重塑全球AI竞争格局。

围绕Anthropic前沿模型遭出口管制下架,一场关于中国大模型追赶时间表的公开辩论正在X平台上演,多方观点的交锋折射出AI行业格局加速重塑的现实。

在智谱AI发布GLM-5.2后,6月18日,一名X用户向独立研究员、AI 开发博主Teortaxes提问"中国大模型何时达到Fable级别"。

Teortaxes给出了7个月的时间差判断,马斯克随即回复"可能(2027年)第一季度",智谱AI CEO唐杰则直接表态"不需要那么久"。

马斯克随后补充,在基准测试上追赶相对容易,但以"真实实用性"衡量,明年Q1也已经相当出色。

这场对话的背景是GLM-5.2在关键编程基准FrontierSWE上取得74.4分,仅落后Anthropic顶级闭源模型Opus 4.8约1个百分点,并超过GPT-5.5。

华尔街见闻此前提及,美国商务部对Anthropic旗下Fable 5和Mythos 5实施出口管制,要求向任何外国人提供访问权限前须取得政府许可证,Anthropic随即关闭两款模型的全球访问权限。

技术追赶与AI成本两股力量同步作用,正在重塑全球AI竞争格局。正如zerohedge所指出的,当"10%的智能差距"可能对应"90%的成本优势"时,逾5万亿美元的资本配置是否存在错配,将成为市场持续追问的核心命题。

时间表之争:从7个月到"不需要那么久"

争论的起点来自Teortaxes对GLM-5.2性能位置的判断。

他认为,GLM-5.2整体能力处于Opus 4.7至4.8区间,他表示Opus的视觉能力本身较弱,综合考虑视觉能力后中国大模型差距大致为7个月。

他的推算逻辑是,Mythos模型于2026年2月初达到Preview状态(即≥Opus 4.8的功能水平),以此类推,中国模型达到完整"Fable"级别的时间窗口约在2026年11月至12月。

马斯克的判断则更为保守,仅以"Probably Q1"回应,对应2027年一季度。

但他随后补充了一个重要分层:在基准测试层面,追赶进展或许确实令人印象深刻;而以"真实实用性"衡量,即便到Q1也已相当不易。

他点名Anthropic的优势正在于专注于提升真实智能,这种能力不显现在基准分数上,但直接反映在营收上。

对于马斯克的言论,有AI业内人士认为,马斯克的预测相对保守,中美模型水平的时间差可能短于7个月。

谷歌DeepMind首席执行官德米斯·哈萨比斯此前也表示,中国的人工智能模型在能力上可能“只差几个月”就能赶上海外。

唐杰的回复则更为简短直接:"won't take that long"——不需要那么久。这一表态隐含了智谱对自身迭代速度的信心,但并未给出具体时间节点。

AI研究机构Proximal评价称,GLM-5.2是"第一个真正缩小了Anthropic/OpenAI与其他模型提供商之间巨大技术鸿沟的模型"。

GLM-5.2的技术坐标:逼近闭源前沿,差距仍存

围绕这场时间表讨论,GLM-5.2的技术指标是核心依据。

6月15日,智谱宣布正式上线并开源新一代旗舰大模型GLM-5.2。在全球百万用户参与盲测的前端开发评估系统Code Arena上,该模型位列全球可用模型第一位。

与以往主打即时问答能力的模型不同,GLM-5.2主攻“长程任务”——让AI不再只做即时问答,而能像人一样连续工作数小时、自主跑完一个完整的大型工程。

根据发布数据,GLM-5.2参数规模为753B,配备1M token稳定上下文窗口,采用MIT协议完全开源。

在长程编程基准FrontierSWE上,GLM-5.2得分74.4,Opus 4.8为75.1,差距约1个百分点,同时超过GPT-5.5的72.6以及Opus 4.7。

在PostTrainBench(测试Agent训练小模型能力)上,GLM-5.2以34.3分排名第二,仅次于Opus 4.8的37.2,高于GPT-5.5的28.4。

差距仍然存在。在最高难度的SWE-Marathon基准上,GLM-5.2得分13.0,而Opus 4.8为26.0,落差明显。

三个基准加在一起,传递的信息是:在中等复杂度的长程任务上,GLM-5.2 已经进入了与顶级闭源模型同台竞争的区间;在最极端复杂度的任务上,它仍然落后,但在开源阵营里独领先位。

Anthropic模型下架,开源替代逻辑加速成立

驱动这场讨论的另一重要背景,是Anthropic旗下Fable 5和Mythos 5的突然下线。

华尔街见闻提及,Anthropic事件暴露出闭源商业模型在可获得性上的脆弱性,并为开源阵营带来了超越技术层面的战略价值。

在GLM-5.2发布的同时,智谱AI CEO唐杰在X平台发表声明:

在前沿模型被无故切断访问的时刻,我们更加确信一件事:科学应当是全球的。通往AGI的道路绝不能由高墙围困。

这一时机选择将开源从技术路线提升至技术主权的叙事层面。该条推文在24小时内获得超过88万次浏览和252条回复。

东方证券认为,开源模型具备开放权重、自主可控、可本地部署等特征,使其成为规避地缘政治风险、保障业务连续性的更优选择。

由于国内模型性能领先、多数开源、API调用成本较低,中国模型已在OpenRouter等Token分发平台上占据领先位置。叠加Anthropic两款模型下架,国产模型API调用量有望进一步提升。

但从中长期逻辑看,成本下降与访问门槛降低,可能推动词元消耗量和算力需求同步扩张。对投资者而言,开源模型份额提升与算力需求高增,正在成为AI产业链重估的核心变量。

风险提示及免责条款
市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。
相关阅读