中国AI的“Max时刻”!千问最强模型开启第二增长曲线

小猫
当Qwen3-Max-Thinking证明了中国在算法上的顶级实力,当阿里云证明了其在算力上的可控,当千问APP证明了AI在商业场景中的落地能力,阿里的AI估值便具备了重构的坚实基础。

回顾2024年至2025年,资本市场对中国科技资产的定价逻辑经历了一场漫长的拉锯。

随着Qwen2.5和DeepSeek的惊艳表现,市场曾短暂掀起过一轮对中国AI的“重估浪潮”。那时候,投资者看到了中国大模型“追平”硅谷的希望,阿里巴巴的股价也曾因此出现修复性反弹。

然而,那轮行情的性质更多是“情绪修复”。

全球资金虽然承认中国科技企业“没有掉队”,但依然顽固地拒绝相信它们能够“领跑”。在华尔街的定价模型中,阿里电商基因依旧强大,其AI与云业务的潜在价值,仅仅被视为一种看涨期权,有潜力,但并非是进攻性的增长引擎。

想要改变这种惯性定价,中国大模型们只能不断用新产品逐渐改变市场看法。

2026年1月26日,阿里云正式发布旗舰推理模型Qwen3-Max-Thinking,性能爆表,甚至在多项全球权威评测中超越GPT-5.2、Gemini 3 Pro,成为首个真正意义上性能最接近国际顶尖模型的国产AI大模型。

值得注意的是,本次模型突破的关键在于模型推理机制的代际升级。

业界普遍的推理计算,往往只会简单增加并行推理路径,通过重复推导已知结论来撞大运,造成了巨大的算力冗余。千问新模型则采用了一种全新的“测试时扩展”(Test-time Scaling)机制。

它引入了“经验提取”式的提炼过程,模型可对此前的推理结果进行多轮自我迭代,在相同的上下文中实现更高效的计算,获得更智能的结果。这是一种让模型“慢思考”的策略,以计算换智能,同时保证了经济性。

基于这一创新,Qwen3-Max-Thinking的推理性能实现了质的飞跃。在启用工具的“人类最后的测试”HLE(Humanity's Last Exam)评测中,千问得分高达58.3。作为对比,OpenAI的GPT-5.2-Thinking得分为45.5,Google的Gemini 3 Pro为45.8。超过10分的差距,在AI评测领域意味着代际级的领先。

面向即将到来的智能体Agent时代,Qwen3-Max-Thinking还大幅增强了自主调用工具的原生能力。

当技术代差不断被抹平,资本市场对阿里巴巴的AI重定价便不再是一个“是否”的问题。

 “拼算力”到“拼智能”,国产AI找到了第二曲线

过去五年,AI行业的发展主线遵循Scaling Laws,即通过堆砌更多的卡、喂更多的数据来提升智能。

然而进入2025年后,这一路径遭遇了物理墙高质量数据枯竭,训练成本指数级爆炸。

从训练转向推理,行业迫切需要第二条增长曲线。

Qwen3-Max-Thinking的核心突破之一便在于测试时扩展这类似于人类心理学中的“系统2”思维当面对高阶数学证明或复杂代码架构时,模型不会立即吐出第一个生成的Token,而是会在后台启动一个深思熟虑的思考过程。

这一过程包含思维链搜索、自我验证与多轮迭代。

千问团队引入了独特的经验提取机制,让模型在推理过程中“学习如何寻找答案”,识别并剪枝冗余的逻辑路径这种机制确保了算力被用于探索最有价值的分支,从而在同等算力消耗下产出极高密度的智能。

作为目前阿里乃至中国科技界规模最大的模型,Qwen3-Max-Thinking总参数超万亿,预训练数据高达36T Tokens。其在HLE测试中的表现极具标志性意义Qwen的高分证明了其技术不仅能解数学题,更能处理现实世界中模糊、多变的任务。

此外,模型实现了原生Agent能力的内化。

在以往,大模型只是“大脑”,需要外挂工具,常导致指令遵循不稳定。Qwen3-Max-Thinking则像专业人士一样,边用工具边思考它可以自主判断何时搜索互联网、何时编写代码、何时查阅知识库,并根据反馈动态调整计划。

这种能力大幅降低了模型幻觉,为企业级应用提供了必要的可靠性保障,展现出了极高的面向Agent时代的规模化工程落地的可能性。

这也意味着,阿里不再是单纯“卖算力”,也不只是提供单个的大模型,而是通过真实可用的完整“智能化解决方案”,探索AI落地的更大可能,从以往的“成本叙事”迈向“价值叙事”。

开源的倒戈:西谷东阿与全球开发者的用脚投票

如果说Qwen3-Max-Thinking的技术突破是阿里的“里子”,那么Qwen系列在开源生态的统治力则是其光鲜的“面子”。这一领域的格局变化,正在重写全球AI的地缘政治版图。

Meta的Llama系列曾被视为开源大模型的默认标准但在2026年1月,这一局面已被彻底打破。

Hugging Face数据显示,基于Qwen的衍生模型数量突破20万个,成为全球首个达成此目标的开源家族。其累计下载量突破10亿次,日均下载量高达110万次,已完全超越Llama,稳居全球第一。

MIT的研究指出,中国开源AI模型的全球采用份额已跃升至17.1%,首次超越美国的 15.8%。

Qwen的胜利源于其“全尺寸、全模态”的策略。从0.5B到480B的全参数段覆盖,以及对119种语言的支持,使其在东南亚、中东等新兴市场迅速成为首选。

更具戏剧性的信号来自硅谷内部。

据彭博社报道,Meta内部代号“牛油果”(Avocado)的秘密项目,不得不开始采用“蒸馏”技术向Qwen学习。扎克伯格亲自关注的新组建的TBD实验室团队,在训练其新模型时蒸馏了多方开源模型,其中就包括 Qwen。

这在技术层面间接承认了Qwen在特定能力上的领先。

英伟达CEO黄仁勋在2025 GTC大会上直言:“中国在开源领域遥遥领先。”这番话为这一趋势做了注脚。

硅谷工程师展现出了极度的实用主义:谁好用就用谁。

全栈的护城河:云、芯、应用与资本市场的估值重构

在分析中国科技巨头时,投资者常犯的一个错误是将阿里简单视为“电商公司+云服务商”。

事实上,AI时代,从底层的基础设施、中间的模型能力、再到上层的应用,综合到一起,才是一家公司AI能力的完整体现。而阿里巴巴正是目前中国唯一、全球唯三具备“算力、模型、应用”全栈闭环能力的科技公司这种全栈优势正在转化为公司护城河。

AI竞争的尽头是能源与算力。

面对英伟达高端芯片的出口限制,阿里的硬件布局展现了极强的前瞻性。阿里平头哥研发的PPU在特定推理任务上的性能已与英伟达H20相当。配合倚天710服务器芯片,阿里构建了“一云多芯”的异构算力体系。

上周,更有市场消息指出,阿里巴巴已决定支持平头哥未来独立上市。这不仅意味着阿里手里多了一张可以在资本市场单独定价的王牌,更意味着国产大模型在底层算力支撑上,有了更充足的底气

但芯片只是起点。AI时代,真正决定企业长期竞争力的,是整套云计算架构能否完成从“通用计算”向“AI原生”的系统性重构,这涉及到计算、存储、网络、乃至MaaS平台的全栈升级。

在这方面,阿里云已构建起目前中国最完整的AI基础设施。摩根士丹利在最新报告中预测,阿里云的收入将在三年内翻倍,从2025财年的1180亿元增长至2028财年的2400亿元。其目标是在2026年拿下中国AI云市场增量的80%。

在应用层,千问APP正快速验证这一技术闭环的商业潜力。

上线首周下载量突破1000万,两个月月活(MAU)即突破1亿。更为关键的是,千问APP正在重新定义AI应用的形态,从一个单纯的聊天机器人,进化成全球首个“能办事”的AI。全面接入淘宝、支付宝、飞猪、高德等生态,用户只需一句语音指令,模型即可自主完成订机票、叫外卖、买东西的全流程。这种“AI+生活全场景闭环”,将AI的价值从信息层推向了交易层,打开了远超订阅制的商业化空间。

AI竞赛中,Capex(资本开支)是通往未来的门票。阿里CEO吴泳铭去年宣布,未来三年将投入超过3800亿元用于建设云和AI硬件基础设施。

对比美股,谷歌、Meta和Amazon同样在疯狂烧钱,因为他们看清了AI带来的赢家通吃效应。阿里高达3000亿级别的投入,应被视为对未来十年竞争资格的买断。

Qwen3-Max-Thinking证明了中国在算法上的顶级实力,当阿里云证明了其在算力上的可控,当千问APP证明了AI在商业场景中的落地能力,阿里的AI估值便具备了重构的坚实基础。

风险提示及免责条款
市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。
相关文章