GPT-5.2提前泄露?今夜,OpenAI要拿Gemini 3祭天!

新智元
不少线索显示,GPT-5.2已经超越Gemini 3,将其踩在脚下。OpenAI首席研究官称,GPT-5.2在编程和逻辑推理任务上的表现,已经超越了Gemini 3和Anthropic的Opus 4.5。在长程任务执行上,GPT-5.2也颇为亮眼,据说能执行“比OpenAI任何模型都明显更长”的任务。

就在今夜,OpenAI或将打响复仇之战。

全体网友枕戈待旦,GPT-5.2随时上线!

目前,已有火眼金睛的网友发现了GPT-5.2的蛛丝马迹。

开发者社区流传的截图显示,Cursor的模型下拉菜单中,赫然出现了gpt-5.2和gpt-5.2-thinking的选项。

GPT-5.2的首战场居然选在了Cursor IDE,而非ChatGPT网页端。

这也意味着,或许OpenAI已经明白:编程不仅是AI的杀手级应用,也是最能体现模型推理能力的领域。

总之,可以预感到,谷歌和OpenAI之间的一场火花四溅的大战,马上就要打响。

网友激动狂呼:今天的圣诞节,要提前来了!

超越Gemini 3?GPT-5.2成最终杀器

不少线索显示,GPT-5.2已经超越Gemini 3,将其踩在脚下。

可以说,它就是OpenAI团队通过微调和改进,专门狙击Gemini 3的。

根据泄露的「大蒜(Project Garlic)」文件及Cursor社区的反馈,GPT-5.2是一款经过彻底重构的专用模型。

是的,GPT-5.2这一承载着OpenAI生死存亡使命的模型,绝非GPT-5的简单微调版。

根据OpenAI首席研究官MarkChen的说法,GPT-5.2在编程和逻辑推理任务上的表现,已经超越了Gemini 3和Anthropic的Opus 4.5。

而且,在长程任务执行上,GPT-5.2也颇为亮眼。

与以往模型写完一段代码就「遗忘」上下文不同,它据说能执行「比OpenAI任何模型都明显更长」的任务。

在Cursor中,这意味着它可以理解整个仓库的架构,并在修改一个文件时自动同步调整引用的其他十几个文件,且极少出现幻觉。

而这种代理能力,就是OpenAI反击Gemini 3生态封锁的关键武器。

GPT-5.2 or 大蒜?

或许你有点糊涂了,GPT-5.2和大蒜是什么关系?

目前公开信息里,「GPT-5.2」和「Garlic(大蒜)模型」不是两个已经分别发布的正式产品名,而是:

Garlic是内部代号,未来很大概率会以GPT-5.2或GPT-5.5的商业名称对外发布,但现在还没有最终定案。

为了查证,我们交叉验证了多个报道,结论就是:Garlic可能会在2026年初以GPT-5.2或GPT-5.5的形式发布。

TechStartups等媒体直接写道:内部计划是,在Garlic稳定后尽快发布,可能以GPT-5.2或GPT-5.5之名亮相

一些跟踪站直接用「Garlic Model – GPT-5.2/5.5 Tracker」这样的标题。

ChatGPT官方账号,今天发布了一张奥特曼烹饪过程需要「大蒜」的内涵图。

大概率,GPT-5.2或者Garlic不远了。

根据泄露资料,GPT-5.2或Garlic模型预计将引入多项重大改进,比如:

  • 增强数学推理能力:以更高精度解决复杂问题,在技术和学术应用中更加高效。
  • 进阶学术推理能力:对专业细微查询的优化处理,将提升其生成详细、上下文感知响应的能力。
  • 更快的处理速度与能效提升:降低延迟和计算成本,使模型更易普及,且符合环境可持续性。
  • 可靠性增强:减少响应中的错误与不一致性,将提升用户信任度和满意度。
  • 可定制性:用户将拥有更大灵活性来调整模型行为,以满足特定需求,实现更个性化的交互体验。

还有更大的?Shallotpeat也来了

而且,OpenAI还憋着一个大招。

除了爆料的GPT-5.2,此前OpenAI还爆料过一个「更大」的模型——Shallotpeat

这个「Shallotpeat」的代号,可是颇有来头。

其中,Shallot意为红葱头,peat为泥炭土。

意译的话,意思就是红葱头在泥炭土中长不好,有这样一层隐喻:现有预训练的土壤不理想,需要重做地基

也就是说,现在OpenAI要重做模型预训练的土壤。

说起来,Shallotpeat背后也有一段故事。

Shallotpeat是奥特曼去年十月向员工透露的、正在开发中的新模型,本就是为了挑战Gemini 3而研发的。

只不过,Gemini 3发布后效果太好,OpenAI和奥特曼都急了。

OpenAI在开发Shallotpeat预训练阶段使用的错误修复方案,也被整合到了Garlic中。

据外媒《The Information》报道,在Gemini 3发布前,奥特曼在一份内部备忘录中警告员工,谷歌近期在AI领域的进展可能会「给公司带来一些暂时的经济逆风」。

他预计,「外面的氛围会有一段时间比较紧张」。

奥特曼明确指出,OpenAI相对于谷歌和Anthropic的领先优势,肉眼可见正在缩小。

这份备忘录提到,谷歌已经开发出一种新AI,似乎在训练方法上超越了OpenAI。

没错,他说的就是Gemini 3。

预训练还没死,且至关重要

有趣的是,预训练在谷歌成功中起到了作用。

奥特曼在说明中承认,谷歌「最近做得非常出色」,尤其是在预训练方面。

此前,主流的说法是「预训练已死」。

但谷歌的成功表明,虽然巨大的性能飞跃可能不会出现,但仍可以获得有效的优势。

在OpenAI今年夏季推出GPT-5之前,就有员工发现:他们在预训练阶段对模型所做的调整,在模型规模较小时还有效,但随着模型规模扩大便不再奏效。

要想赶上谷歌,OpenAI就必须解决这些预训练阶段的问题。

而在开发Shallotpeat的过程中,OpenAI就在努力修复在预训练过程中遇到的错误。

奥特曼的冲刺:放弃AGI,全力抵御谷歌!

长久以来,OpenAI的首要目标都是造福「全人类」的AGI。

而现在,为了在竞争中不掉队,奥特曼显然放下了AGI这个目标。

上周,OpenAI敦促内部以延迟广告和个人助理为代价,提升ChatGPT的质量。

如今,更多信息暗示OpenAI「可能不得不暂停」其追求AGI的进程,以保公司生存。

承认这一点,无疑令人震惊,这也凸显了公司面临的巨大压力,因为公司计划在未来五年内投入超过一万亿美元建设基础设施。

不过,在年终成绩单上,OpenAI暂时可以得到慰藉。

最近出炉的苹果官方确认的2025年费App排行榜上,ChatGPT还是位列第一,Gemini则排在很后面。

谷歌和OpenAI共同面对的困境:算力的零和博弈

谷歌Gemini 3的横空出世,显然给OpenAI带来了巨大压力。

奥特曼已经急了。

据《华尔街日报》报道,他没有借助专业人员来审核工具的输出,而是希望「更好地利用用户信号」。

换句话说,ChatGPT正在加倍重视用户反馈以提升参与度——即使这意味着让模型更具谄媚性,这可能带来灾难性的副作用。

OpenAI和谷歌之间,现在就是一场你追我赶、势均力敌的竞赛。

GPT-5.2和Gemini 3 Flash迎头对打;另一边,NanoBananaPro风光无限,Sora则很可能被暂时搁置。

虽然官方解释说,暂停Sora是由于安全审查、Deepfake风险,但背后的工程逻辑是冰冷的算力经济学。

毕竟,视频生成模型的训练和推理所需的算力是文本模型的数个数量级。

在算力集群供应有限的情况下,OpenAI面临一个零和博弈——

是继续训练一个可能在法律上受阻、变现困难的视频模型(Sora),还是将所有算力集中到能够产生直接收入、保住核心用户盘的文本/推理模型(GPT-5.2)上?

「红色警报」迫使OpenAI选择了后者。在谷歌拥有TPU集群的无限弹药库面前,OpenAI必须集中火力。

有趣的是,OpenAI的老对家谷歌的日子,也并没有那么好过。

2025年12月全球「配额休克」

2025年12月初,全球开发者社区突然爆发了恐慌。

大量依赖Google AI Studio进行开发的程序员发现,Gemini API的免费层(Free Tier)几乎在一夜之间变得不可用。

  • Gemini 2.5 Pro
    免费配额(RPD - Requests Per Day)直接归零 。
  • Gemini 2.5 Flash
    从每天上千次请求被削减至每天仅20次 。
  • 报错信息
    开发者频繁收到429: Resource Exhausted错误,即便是轻量级脚本也无法运行 。

这一变化并非渐进式的调整,而是断崖式的切断。

对于很多正在使用谷歌API开发者来说,这意味着项目的瞬间瘫痪 。

Google AI Studio免费额度的取消,与Google旗舰图像生成模型Nano Banana Pro(即Gemini 3 Pro Image)的规模化部署存在直接且必然的因果关系。

Nano Banana Pro不仅仅是一个图像生成工具,它是导致此次算力资源大洗牌的核心变量。

它之所以能逼迫谷歌牺牲免费层用户,是因为其架构设计对算力的需求,达到了前所未有的高度。

Google AI Studio产品负责人 Logan Kilpatrick面对社区质疑时,直接证实了算力资源向新模型倾斜的事实。

是的,我们降低或取消了一批模型的免费层级,目的是释放算力,以应对3.0 Pro和Nano Banana Pro所面临的巨大增长需求

总之,今晚即将爆发的AI大战,你准备好了么?

本文来源:新智元

 
风险提示及免责条款
市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。
相关文章