阿里Qwen猛追DeepSeek

技术迭代加速,生态竞争白热化。

作者 | 刘宝丹

编辑 | 黄昱

46天前,DeepSeek-R1正式发布,并同步开源模型权重,App也做了更新。此后,DeepSeek火遍全球,带领中国AI向前迈出一大步。46天之后,阿里复制了这一路径。

3月6日凌晨,阿里发布并开源全新的推理模型通义千问QwQ-32B,该模型整体性能比肩DeepSeek-R1,并将部署成本进一步降到了消费级显卡水平上。同时,用户也可通过通义APP免费体验该模型。

这意味着,继DeepSeek、腾讯、月之暗面等公司之后,阿里也正式推出了深度推理模型,这将加速模型在更复杂场景的应用落地。

千问QwQ-32B是阿里探索推理模型的最新成果,推理能力叠加低消耗,使得该模型适合快速响应或对数据安全要求高的应用场景。不过,多位业内人士均对华尔街见闻表示,该模型的市场反馈还需要一段时间观望。

当日收盘,阿里港股报140.8港元,创近三年新高,当日股价涨幅8.39%。年初以来,阿里股价涨幅超过70%,市值达2.68万亿港元。当日美股收盘,阿里股价微跌0.77%。

全球AI竞赛正处于关键的攻坚阶段,阿里的硬仗才刚刚开始。

推理成本再降

DeepSeek是当前最受青睐的AI大模型,如今,阿里准备取而代之。

这次,阿里发布的通义千问QwQ-32B属于中等参数模型,它最大的亮点是做到了大参数推理模型才具备的效果,很大程度上证明了,参数规模不再是模型性能的决定性因素。

根据阿里公布的一系列权威基准测试,千问QwQ-32B模型表现异常出色,几乎完全超越了OpenAI-o1-mini,比肩最强开源推理模型DeepSeek-R1,后者拥有6710亿参数。

比如,在测试数学能力的AIME 24评测集上,以及评估代码能力的LiveCodeBench中,千问QwQ-32B表现与DeepSeek-R1相当,远胜于o1-mini及相同尺寸的R1蒸馏模型。在LiveBench、谷歌等提出的IFEval评测集、由加州大学伯克利分校等提出的BFCL测试中,千问QwQ-32B的得分均超越了DeepSeek-R1。

千问QwQ-32B在保持强劲性能的同时,大幅降低了部署使用成本。阿里表示,该模型在消费级显卡上也能实现本地部署。

北京星汉未来创始人、CEO刘道儒对华尔街见闻表示,DeepSeek-R1满血版是671B,对部署配置要求非常高,需要至少8张A100显卡,QwQ-32B的话,英伟达4090的增强版就能部署,成本是R1的1/10以内,会更利于推理模型的应用和普及。

千问QwQ-32B更高的性价比背后,得益于阿里采取了不同的技术路线。华尔街见闻从内部人士处获悉,该模型采用了密集架构(Dense),而DeepSeek是混合专家系统(MoE),Dense和MoE是模型架构的两种形态。

该人士进一步表示,阿里通义团队在冷启动基础上,针对数学和编程任务、通用能力分别进行了两轮大规模强化学习,在32B的模型尺寸上获得了令人惊喜的推理能力提升,印证了大规模强化学习可显著提高模型性能。

阿里云内部员工称,推理模型内部做了很久,公司从农历正月初二起加班,每天工作至凌晨两点之后,现在也是这个状态,公司上周发布了预览版,紧接着这周就发布正式版并开源。

在业内看来,千问QwQ-32B进一步降低了模型的应用成本,尤其该模型既能提供极强的推理能力,又能满足更低的资源消耗需求,适合快速响应或对数据安全要求高的应用场景,开发者和企业可以在消费级硬件上将其部署到本地设备中,打造AI解决方案。

目前,千问QwQ-32B已在魔搭社区、HuggingFace及GitHub等平台基于宽松的Apache2.0协议开源,所有人都可免费下载模型进行本地部署。用户也将可通过通义APP免费体验最新的千问QwQ-32B模型。

对于云端部署需求,用户可通过阿里云PAI平台完成快速部署,并进行模型微调、评测和应用搭建;或是选择容器服务ACK搭配阿里云GPU算力,实现模型容器化部署和高效推理。

全球继续开源

如果说DeepSeek带火了中国AI产业,那阿里无疑是承接这一波AI红利的赢家之一。

2月24日,阿里巴巴集团CEO吴泳铭宣布,未来三年,阿里将投入超过3800亿元,用于建设云和AI硬件基础设施,总额超过去十年总和。这也创下中国民营企业在云和AI硬件基础设施建设领域有史以来最大规模投资纪录。

阿里对AI进行了广泛的布局,包括云计算、模型以及自身生态体系的应用,但归根到底,阿里最看重的主线是支撑AI应用的云计算市场。

2月21日,在最新季度电话会上,阿里表示,阿里AI战略的首要目标是追求实现AGI,不断突破模型智能能力边界,智能就是AI模型背后输出的token,未来90%的token将在云计算网络上生成和输出,通过阿里云遍布全球的数据中心,才能以更快的方式输送给全球开发者。

对阿里来说,一个重要策略就是开源。作为国内最早开源自研大模型的大厂,阿里云在业界率先实现“全尺寸、全模态、多场景”开源。

在QwQ-32B之前,阿里今年已经先后开源了100万Tokens上下文的Qwen2.5-1M模型,以及视觉模型Qwen2.5-VL。去年11月,阿里开源了通义千问代码模型全系列,共6款Qwen2.5-Coder模型。

2023年至今,阿里通义团队已开源200多款模型,包含大语言模型千问Qwen及视觉生成模型万相Wan等两大基模系列,开源囊括文本生成模型、视觉理解/生成模型、语音理解/生成模型、文生图及视频模型等全模态,覆盖从0.5B到110B等参数。

据阿里内部人士介绍,截至目前,海内外AI开源社区中千问Qwen的衍生模型数量突破10万,超越美国Llama系列模型,成为全球最大的开源模型家族。

在刘道儒看来,模型开源最有利的还是阿里云等云厂商,模型门槛降低了,但算力的门槛还是很高的,不管推理还是训练都需要用到大规模的GPU算力,因此阿里全力推动开源。

阿里云首席技术官周靖人曾对华尔街见闻表示,希望能以开放心态把先进技术开源出来,让大家做并行探索。AI产品也一样,通过开源的体系跟企业一起探索,不仅仅是模型能力提升,更重要的是基于模型能够做什么,把它的前景和潜力深入地挖掘出来。

不过,阿里QwQ-32B开源后的效果还需要时间来进一步观察。有业内人士表示担忧,当前推理模型主要是用来做数学题和写代码,但DeepSeek出圈的是文学创作和思想性的内容,从用户视角达到“比肩”效果并不容易。

可以确定的是,开源已经成为AI发展的主流。DeepSeek通过开源周活动公布了最新技术进展,包括FlashMLA、DeepEP、DeepGEMM和3FS四个开源项目,以及DualPipe、EPLB等代码库,并在最后一天披露了理论上的成本利润率545%这一数字。

3月6日,腾讯混元发布图生视频模型并对外开源。目前,混元开源系列模型在Github累计获得超2.3万开发者关注和star(星标)。百度近日也宣布,文心大模型4.5将于3月16日发布,并于6月30日正式开源。

2月18日,阶跃星辰首次将开源视频生成模型Step-Video-T2V和开源语音交互大模型Step-Audio向全球开发者开源。更早之前,MiniMax开源了MiniMax-01全新系列模型,包含基础语言大模型MiniMax-Text-01和视觉多模态大模型MiniMax-VL-01。

同期,月之暗面也公布了稀疏注意力技术——MoBA(MixtureofBlockAttention),这是一种受专家混合(MoE)和块稀疏注意力(BlockSparseAttention)启发的注意力架构,能够在全注意力和稀疏注意力模式之间无缝切换,使其成为长上下文任务的有效解决方案。

各家AI公司纷纷拿出自己压箱底儿的技术路线背后,AI行业已经从最初的技术竞赛大步迈向应用落地,后者将是2025年AI公司最激烈的战场。

AI应用之战

开源已经成为多数AI企业的选择,甚至在很多人眼里,是否开源关系着公司能否在这场AI军备赛中拔得头筹。

在上述内部人士看来,行业最早开源是一个无奈之举,因为大家的水平跟OpenAI开发的GPT差距比较大,需要追赶,如果不开源,差距只会越来越大,现在开源模型和GPT的能力已经很小,现在开源更多是抢占行业话语权。

阶跃星辰创始人、CEO姜大昕表示,开源是希望分享最新技术成果,更重要的是,多模态模型是实现AGI的必经之路,目前尚处于早期阶段,需要开发者集思广益,共同拓展模型技术边界,并推动产业落地。

“不开源就开除。”一位提供AI云基础设施的公司高管对华尔街见闻表示,今年春节前后,DeepSeek陆续开源了基础模型和推理模型,其他模型公司被逼得没有办法,不开源都活不下去,也融不到钱。

多位业内人士表示,当前行业对开源模式的强烈推崇,本质在于,开源已成为推动技术迭代、生态构建、市场扩张的核心策略,而闭源或“伪开源”模式则可能因技术壁垒难以维系或生态封闭性逐渐失去竞争力。

不过,开源也带来了商业化上的挑战。对很多AI模型厂商来说,此前的主要收费方式是按Token给API定价,如今将模型权重开源之后,如何实现盈利的可持续增长成为亟需破解的难题。

一位AI模型厂商内部人士表示,这可能会倒逼模型公司重新思考商业模式,公司的商业重心会往服务端走。模型落地要考虑的问题非常多,如果应用在生产环节,要考虑产品设备的稳定性和性能,模型需要很多配套的工具链。“提供企业级服务是未来比较有商业价值的地方。”

刘道儒认为,开源之后模型微调、蒸馏等需求也会剧增,微调、蒸馏还是有门槛的,其他模型公司可以帮助企业在垂直场景落地。此外,像多模态大模型、语音大模型等不同类型的大模型由于通用性不强、算力要求高,也相对适合其他大模型厂商。

目前,AI大模型厂商已经开始把重点放在垂类应用上,以期打造出差异化竞争力。3月3日,AI独角兽百川智能启动了一轮裁员,金融行业ToB业务团队被裁撤,员工当天就签署了离职协议。

华尔街见闻从百川内部获悉,公司优化金融业务是为了集中资源,聚焦核心优势业务,加速实现“造医生、改路径、促医学”的愿景。据了解,百川与北京儿童医院共同研发的AI儿科医生已在疑难病例的顶级专家会诊中正式“上岗”。

AI Agent被认为是2025年AI落地的最重要产品形态。3月6日,全球首款通用AI Agent Manus迅速火爆整个社交圈,它在写文章、做PPT、写分析报告等能力上表现出色,虽然目前仍有不少质疑声,但Manus爆火本身说明,市场对AI Agent已经有了很大期待。

目前,智谱、MiniMax和阶跃星辰等都在大力发展AI Agent。长上下文能力与多模态处理能力的提升,是发展AI Agent的必要条件,这也被认为是AI创业公司接下来最重要的机遇。

去年12月,智谱披露了Agent新进展,公司发布的AutoGLM可以自主执行超过50步的长步骤操作,也可以跨app执行任务,AutoGLM被认为是迈向AI智能操作系统的重要尝试。近日,智谱与三星达成合作,未来会将Agent体验带到三星最新手机GalaxyS25系列上。

此外,千问QwQ-32B模型也集成了与智能体Agent相关的能力,使其能够在使用工具的同时进行批判性思考,并根据环境反馈调整推理过程。阿里通义团队表示,未来将继续探索将智能体与强化学习的集成,以实现长时推理,探索更高智能进而最终实现AGI的目标。

在经过两年的AI技术竞赛后,AI市场正在迎来新一轮大洗牌,阿里、腾讯、字节凭借各自庞大的生态优势崭露头角,对于AI创业公司来说,未来的机会点仍然是找到差异化能力,并持续打造竞争壁垒。

这会是异常残酷的淘汰赛,枪声已经打响了。

风险提示及免责条款
市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。
相关文章