GPT-5.2提前泄露？今夜，OpenAI要拿Gemini 3祭天！

新智元

2025/12/11 14:08

不少线索显示，GPT-5.2已经超越Gemini 3，将其踩在脚下。OpenAI首席研究官称，GPT-5.2在编程和逻辑推理任务上的表现，已经超越了Gemini 3和Anthropic的Opus 4.5。在长程任务执行上，GPT-5.2也颇为亮眼，据说能执行“比OpenAI任何模型都明显更长”的任务。

就在今夜，OpenAI或将打响复仇之战。

全体网友枕戈待旦，GPT-5.2随时上线！

目前，已有火眼金睛的网友发现了GPT-5.2的蛛丝马迹。

开发者社区流传的截图显示，Cursor的模型下拉菜单中，赫然出现了gpt-5.2和gpt-5.2-thinking的选项。

GPT-5.2的首战场居然选在了Cursor IDE，而非ChatGPT网页端。

这也意味着，或许OpenAI已经明白：编程不仅是AI的杀手级应用，也是最能体现模型推理能力的领域。

总之，可以预感到，谷歌和OpenAI之间的一场火花四溅的大战，马上就要打响。

网友激动狂呼：今天的圣诞节，要提前来了！

超越Gemini 3？GPT-5.2成最终杀器

不少线索显示，GPT-5.2已经超越Gemini 3，将其踩在脚下。

可以说，它就是OpenAI团队通过微调和改进，专门狙击Gemini 3的。

根据泄露的「大蒜（Project Garlic）」文件及Cursor社区的反馈，GPT-5.2是一款经过彻底重构的专用模型。

是的，GPT-5.2这一承载着OpenAI生死存亡使命的模型，绝非GPT-5的简单微调版。

根据OpenAI首席研究官MarkChen的说法，GPT-5.2在编程和逻辑推理任务上的表现，已经超越了Gemini 3和Anthropic的Opus 4.5。

而且，在长程任务执行上，GPT-5.2也颇为亮眼。

与以往模型写完一段代码就「遗忘」上下文不同，它据说能执行「比OpenAI任何模型都明显更长」的任务。

在Cursor中，这意味着它可以理解整个仓库的架构，并在修改一个文件时自动同步调整引用的其他十几个文件，且极少出现幻觉。

而这种代理能力，就是OpenAI反击Gemini 3生态封锁的关键武器。

GPT-5.2 or 大蒜？

或许你有点糊涂了，GPT-5.2和大蒜是什么关系？

目前公开信息里，「GPT-5.2」和「Garlic（大蒜）模型」不是两个已经分别发布的正式产品名，而是：

Garlic是内部代号，未来很大概率会以GPT-5.2或GPT-5.5的商业名称对外发布，但现在还没有最终定案。

为了查证，我们交叉验证了多个报道，结论就是：Garlic可能会在2026年初以GPT-5.2或GPT-5.5的形式发布。

TechStartups等媒体直接写道：内部计划是，在Garlic稳定后尽快发布，可能以GPT-5.2或GPT-5.5之名亮相。

一些跟踪站直接用「Garlic Model – GPT-5.2/5.5 Tracker」这样的标题。

ChatGPT官方账号，今天发布了一张奥特曼烹饪过程需要「大蒜」的内涵图。

大概率，GPT-5.2或者Garlic不远了。

根据泄露资料，GPT-5.2或Garlic模型预计将引入多项重大改进，比如：

增强数学推理能力：以更高精度解决复杂问题，在技术和学术应用中更加高效。
进阶学术推理能力：对专业细微查询的优化处理，将提升其生成详细、上下文感知响应的能力。
更快的处理速度与能效提升：降低延迟和计算成本，使模型更易普及，且符合环境可持续性。
可靠性增强：减少响应中的错误与不一致性，将提升用户信任度和满意度。
可定制性：用户将拥有更大灵活性来调整模型行为，以满足特定需求，实现更个性化的交互体验。

还有更大的？Shallotpeat也来了

而且，OpenAI还憋着一个大招。

除了爆料的GPT-5.2，此前OpenAI还爆料过一个「更大」的模型——Shallotpeat。

这个「Shallotpeat」的代号，可是颇有来头。

其中，Shallot意为红葱头，peat为泥炭土。

意译的话，意思就是红葱头在泥炭土中长不好，有这样一层隐喻：「现有预训练的土壤不理想，需要重做地基」。

也就是说，现在OpenAI要重做模型预训练的土壤。

说起来，Shallotpeat背后也有一段故事。

Shallotpeat是奥特曼去年十月向员工透露的、正在开发中的新模型，本就是为了挑战Gemini 3而研发的。

只不过，Gemini 3发布后效果太好，OpenAI和奥特曼都急了。

OpenAI在开发Shallotpeat预训练阶段使用的错误修复方案，也被整合到了Garlic中。

据外媒《The Information》报道，在Gemini 3发布前，奥特曼在一份内部备忘录中警告员工，谷歌近期在AI领域的进展可能会「给公司带来一些暂时的经济逆风」。

他预计，「外面的氛围会有一段时间比较紧张」。

奥特曼明确指出，OpenAI相对于谷歌和Anthropic的领先优势，肉眼可见正在缩小。

这份备忘录提到，谷歌已经开发出一种新AI，似乎在训练方法上超越了OpenAI。

没错，他说的就是Gemini 3。

预训练还没死，且至关重要

有趣的是，预训练在谷歌成功中起到了作用。

奥特曼在说明中承认，谷歌「最近做得非常出色」，尤其是在预训练方面。

此前，主流的说法是「预训练已死」。

但谷歌的成功表明，虽然巨大的性能飞跃可能不会出现，但仍可以获得有效的优势。

在OpenAI今年夏季推出GPT-5之前，就有员工发现：他们在预训练阶段对模型所做的调整，在模型规模较小时还有效，但随着模型规模扩大便不再奏效。

要想赶上谷歌，OpenAI就必须解决这些预训练阶段的问题。

而在开发Shallotpeat的过程中，OpenAI就在努力修复在预训练过程中遇到的错误。

奥特曼的冲刺：放弃AGI，全力抵御谷歌！

长久以来，OpenAI的首要目标都是造福「全人类」的AGI。

而现在，为了在竞争中不掉队，奥特曼显然放下了AGI这个目标。

上周，OpenAI敦促内部以延迟广告和个人助理为代价，提升ChatGPT的质量。

如今，更多信息暗示OpenAI「可能不得不暂停」其追求AGI的进程，以保公司生存。

承认这一点，无疑令人震惊，这也凸显了公司面临的巨大压力，因为公司计划在未来五年内投入超过一万亿美元建设基础设施。

不过，在年终成绩单上，OpenAI暂时可以得到慰藉。

最近出炉的苹果官方确认的2025年费App排行榜上，ChatGPT还是位列第一，Gemini则排在很后面。

谷歌和OpenAI共同面对的困境：算力的零和博弈

谷歌Gemini 3的横空出世，显然给OpenAI带来了巨大压力。

奥特曼已经急了。

据《华尔街日报》报道，他没有借助专业人员来审核工具的输出，而是希望「更好地利用用户信号」。

换句话说，ChatGPT正在加倍重视用户反馈以提升参与度——即使这意味着让模型更具谄媚性，这可能带来灾难性的副作用。

OpenAI和谷歌之间，现在就是一场你追我赶、势均力敌的竞赛。

GPT-5.2和Gemini 3 Flash迎头对打；另一边，NanoBananaPro风光无限，Sora则很可能被暂时搁置。

虽然官方解释说，暂停Sora是由于安全审查、Deepfake风险，但背后的工程逻辑是冰冷的算力经济学。

毕竟，视频生成模型的训练和推理所需的算力是文本模型的数个数量级。

在算力集群供应有限的情况下，OpenAI面临一个零和博弈——

是继续训练一个可能在法律上受阻、变现困难的视频模型（Sora），还是将所有算力集中到能够产生直接收入、保住核心用户盘的文本/推理模型（GPT-5.2）上？

「红色警报」迫使OpenAI选择了后者。在谷歌拥有TPU集群的无限弹药库面前，OpenAI必须集中火力。

有趣的是，OpenAI的老对家谷歌的日子，也并没有那么好过。

2025年12月全球「配额休克」

2025年12月初，全球开发者社区突然爆发了恐慌。

大量依赖Google AI Studio进行开发的程序员发现，Gemini API的免费层（Free Tier）几乎在一夜之间变得不可用。

Gemini 2.5 Pro
免费配额（RPD - Requests Per Day）直接归零。
Gemini 2.5 Flash
从每天上千次请求被削减至每天仅20次。
报错信息
开发者频繁收到429: Resource Exhausted错误，即便是轻量级脚本也无法运行。

这一变化并非渐进式的调整，而是断崖式的切断。

对于很多正在使用谷歌API开发者来说，这意味着项目的瞬间瘫痪。

Google AI Studio免费额度的取消，与Google旗舰图像生成模型Nano Banana Pro（即Gemini 3 Pro Image）的规模化部署存在直接且必然的因果关系。

Nano Banana Pro不仅仅是一个图像生成工具，它是导致此次算力资源大洗牌的核心变量。

它之所以能逼迫谷歌牺牲免费层用户，是因为其架构设计对算力的需求，达到了前所未有的高度。

Google AI Studio产品负责人 Logan Kilpatrick面对社区质疑时，直接证实了算力资源向新模型倾斜的事实。

是的，我们降低或取消了一批模型的免费层级，目的是释放算力，以应对3.0 Pro和Nano Banana Pro所面临的巨大增长需求。

总之，今晚即将爆发的AI大战，你准备好了么？

本文来源：新智元

风险提示及免责条款

市场有风险，投资需谨慎。本文不构成个人投资建议，也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资，责任自负。