阿里云的一把火,将大模型界的降价潮推向高潮。
5月21日,阿里云官宣称,通义千问GPT-4级主力模型Qwen-Long,API输入价格从0.02元/千tokens直降97%至0.0005元。就在一周前,字节跳动正式对外发布豆包大模型,其中豆包通用模型pro(0.0008元/千Tokens)号称击破行业底价,比阿里通义千问Qwen 2.5-max(30k)0.12元/千tokens低99.3%。
显然阿里云这与字节硬刚上了。而当这位云服务龙头公司加入战局后,大模型价格之战也愈发白热化。
在阿里云宣布降价后,百度宣布文心大模型的两款主力模型ENIRE Speed、ENIRE Lite免费,即刻生效;科大讯飞也宣布讯飞星火Lite API永久免费开放,讯飞星火顶配版(Spark3.5 Max)API价格低至0.21/万Tokens;腾讯的混元模型也紧跟其后,lite模型全面免费,标准版、pro版降价幅度达到50-70%。
商用大模型自此进入“厘元”甚至“0元”时代。换算下来,现实世界1元只能坐一趟公交,但在字节的豆包能读三本《三国演义》(125万tokens,约合200万个汉字);在阿里云的通义千问直接能掌握5本《新华字典》(200万tokens,约合320万个汉字)。
这场国产大模型的价格战,像极了曾经“网约车大战”、“百亿补贴”等互联网打法,这似乎也意味着国内大模型行业已经从技术之争,提前来到抢客、圈地的新阶段。他们试图通过价格战,让更多用户在自己的生态上开发应用,加速AI应用落地。
实际上,在阿里和字节杀价前,大模型界就已刮起降价之风。
5月初,私募巨头幻方旗下的AI公司DeepSeek打出第一枪,推出新版大模型,价格降到千token/0.001元,而后智谱、面壁等AI明星企业相继宣布降价,很快字节、阿里云、百度、腾讯四巨头加入混战,空气中弥漫起浓浓血腥味。
在业内人士看来,已经狂卷了一年多技术的AI公司,始终没看到大模型应用大规模爆发的趋势,商业变现更遥遥无期。然而如今互联网业到了用户、流量趋于见顶,技术走到平台重构生态的关键节点,这是巨大的想象空间。此时大模型的价格战,或许就是高效的催化剂。
火山引擎总裁谭待指出,AI应用场景的落地一方面要技术提升,另外应用生态是一堆零星个人群体智慧的聚集,“必须低门槛这个事才能做起来”。
“以前企业做创新担心ROI难回正,90%创新项目会失败。现在模型降价后,试错成本直接(从80万)降到8000元。失败成本可控,这让很多企业轻装上阵,无负担投身到AI大潮”。谭待表示,试想未来大模型在人们日常生活每天都用,低价是真正广泛应用的前提,所以降价是当下最迫切的事。
事实上,大模型经历了一年前野蛮的生长后,给用户的体验感也趋于同质化、迭代的增长曲线开始放缓,就连超级独角兽OpenAI都开始强调“性价比”了。5月中旬,OpenAI公布了最新的GPT-4o,技术层面上的迭代已不再是现象级的变革,抓眼的反而是“全场5折”的促销牌。
自去年初以来,OpenAI在不断释放新模型的同时进行了4次降价,整体降幅在每年50-75%。行业标杆尚且如此,国内互联网时代熏陶下的AI公司们,自然也玩起熟悉的“拼低价”。
对下游企业来说,推理成本进一步降低,AI应用行业有望迎来成本拐点。华龙证券认为,更多C端用户有望免费使用基础AI应用,庞大的访问量有助于企业进一步提升模型服务能力,完成良性循环。
“阿里云这次大幅降低大模型推理价格,就是希望加速AI应用的爆发。预计今年大模型API的日调用次数有望破百亿”。阿里云副总裁、公共云事业部总裁刘伟光直言。
以大模型生态为“饵”,将用户公司引入自家云服务的“鱼塘”,则是阿里云解决增长难题的“阳谋”。当前,企业更多通过“公共云+API”调用大模型,将大模型降价甚至免费,有利于阿里云吸引更多开发者和企业用户,构建起其在AI领域的全新生态,甚至进一步扩大其市场份额。
这也使得在这轮大模型价格战当中,阿里云的动作如此迅速。
2024财年四季报显示,阿里云虽继续盈利,但收入同比增长仅3%至255.95亿元,倘若剔除阿里巴巴并表业务的收入,阿里云收入已经连续多个季度同比下滑。
财报会上,阿里表示目前其手上的现金流足以用于战略再投资,预计未来将产生三大成果,其中重点之一就是让阿里云在2025财年下半年重回两位数增长。阿里云CEO吴泳铭表示,公共云和人工智能产品将成为主推力。
按照吴泳铭预期,阿里云要成为阿里面向未来的“第二增长曲线”。
包括字节跳动旗下火山引擎、百度云等云服务商,都试图接着AI之利,向阿里云、腾讯云等霸主发起冲锋。云服务市场也在AI时代里,洗牌、重构。
一场大规模淘汰赛随之掀开序幕。不过,随着这场竞赛让更多开发者能够以更低成本开发AI应用,各家互联网大厂、AI创业公司也在逐渐构建起AI的生态系统。AI走进寻常百姓手中,已然不远。