作者 | 刘宝丹 周智宇
编辑 | 张晓玲
2025年的春节,本应是字节跳动AI产品豆包的高光时刻。然而,随着DeepSeek-R1的开源与用户量爆发式增长,以及腾讯元宝“借力打力”,打乱了字节原本的步伐。
这轮AI浪潮里,字节本就是个后来者。2023年,字节才开始在内部会议上讨论GPT,过去两年加紧对AI进行了大量投入,包括大手笔的投流。
凭借这种大力出奇迹的模式,字节豆包用户量突破7500万,去年底成功跻身第一梯队。然而,顶流的位子还没坐稳,字节就遇到了DeepSeek。
字节也开始反击。华尔街见闻从知情人士处获悉,豆包已小范围测试深度思考模型的不同实验版本,这较其原本规划大幅提前。更多变化也在悄然发生,3月3日,字节技术团队宣布,中国首个AI原生集成开发环境(AI IDE)Trae 国内版正式上线,支持切换满血版DeepSeek R1、V3模型。
问题在于,面对DeepSeek的“技术奇袭”,字节的工业化流量思维,能否让它拿到 “新时代船票”,要打上个问号。
在上周民企座谈会上,新质生产力企业Deepseek创始人梁文锋、宇树科技创始人王兴兴、马云、马化腾等受邀参会,张一鸣却未能入列,此中深意,意味深长。
从今日头条、抖音到TikTok,字节凭借推荐算法打造出三个爆款APP,并借着直播电商的东风一举成为互联网新王。然而,国内用户增长见顶叠加全球化遭遇监管风险,字节业绩增长被迫放缓,AI成为解题关键。
被冠以“应用工厂”之称的字节,能否打造出AI时代的超级应用,决定着公司未来能否继续卫冕王位,而DeepSeek的出现意味着,这条路远比字节想象的更难走。
豆包受阻
去年下半年,字节通过“流量灌溉+价格屠刀”的组合拳,将豆包推上了国内AI对话应用的榜首。QuestMobile数据显示,截至2024年12月,AI原生APP月度活跃用户已经突破1.2亿,同比增长232%,豆包月活跃用户规模为7523万,位居行业第一,正在加速追赶Open AI旗下的ChatGPT。
然而DeepSeek爆火,打断了豆包的节奏。QuestMobile数据显示,2月1日,DeepSeek APP端日活用户就已经突破3000万,它成为史上最快突破3000万用户的应用。2月13日,腾讯元宝宣布接入DeepSeek-R1满血版,同时支持混元和DeepSeek两大模型。2月22日,元宝超越豆包,升至中国区苹果免费APP下载排行榜第二。
AI原生APP三强格局本是豆包、Kimi和文小言,如今主角已经变成DeepSeek、元宝和豆包,且豆包的增长势头不如前两者迅猛。短短两个多月,AI头部应用就迎来大换血,可见竞争之激烈。
更重要的是,腾讯将微信生态与DeepSeek的技术优势结合,构建了“社交+AI”的护城河,相比之下,字节的豆包仍局限于独立APP形态,缺乏生态协同的纵深。
字节也在谋划反攻。近日,很多用户在使用豆包APP时发现,生成的回复中会显示思维链(Chain-of-Thought)。接近字节人士表示,这是在小范围测试深度思考模型。华尔街见闻从投资机构人士处获悉,字节的推理模型预计3个月之后会推出。
该人士认为,自从DeepSeek R1上线并开源,推理就已经成为AI应用中的必备功能,豆包上线推理功能在意料之内。推理可以像人一样分析问题,回答更有逻辑性。他表示,通用基础模型像知识库,推理模型像学霸,前者记忆力超强,擅长生成流畅文本、回答常见问题,但复杂逻辑容易出错,而学霸会先理解问题本质,再分步骤验证逻辑链。
在此之前,国内大模型已有推理功能。月之暗面是国内最早发布推理模型的独角兽之一,2024年11月,Kimi 正式发布新一代数学推理模型 k0-math,在多项基准能力测试中,该模型的数学能力可对标全球领先的OpenAI o1 系列可公开使用的两个模型:o1-mini和o1-preview。
Kimi创始人杨植麟此前曾对华尔街见闻表示,基于强化学习、合成数据和思维链的新技术,将提升AI在各个领域和场景的推理能力和智能水平上限,更强大的推理能力,将会帮助每个用户解锁更多有挑战性的工作任务。
2月20日,阿里巴巴集团CEO吴泳铭在财报会上表示,阿里将于近期发布基于千问Qwen2.5-MAX的深度推理模型。5天后,阿里Qwen团队宣布发布新推理模型——深度思考 (QwQ) ,该模型是一个基于Qwen2.5-Max的推理模型,擅长数学理解、编程、AI 智能体等。推理模型已经成为兵家必争之地。
华尔街见闻从字节内部人士处了解到,其实字节早就注意到了推理模型,只是当时没有给予足够的重视。
2月13日,在字节新一期All Hands全员会上,字节CEO梁汝波表示,去年9月Open AI发布长链思考模型引起关注后,字节意识到技术重大变化,但没有觉得要马上复现出来。他直言,如果字节一开始重大问题就争先,有机会更早实现。
这已经不是字节第一次对AI反应滞后。一年前的全员会上,梁汝波就曾表示,公司对机会的敏感度不如创业公司。公司层面的半年度技术回顾,直到2023年才开始讨论GPT,而业内做得比较好的大模型创业公司都是在2018年至2021年创立的。
对于推理模型,直到今年1月,豆包大模型1.5Pro正式发布,该模型在能力升级基础上进一步提升多模态能力,它使用MoE架构,并通过训练-推理一体化设计,探索模型性能和推理性能之间的极致平衡。
华尔街见闻获悉,字节尝试用大规模RL的方法不断提升模型的推理能力,在完全不使用其他模型数据的条件下,通过RL算法的突破和工程优化,充分发挥TestTime Scaling的算力优势,完成了RL Scaling,研发了Doubao深度思考模式。
据字节内部人士介绍,字节阶段性成果Doubao-1.5-pro-AS1-Preview在AIME上已经超过O1-preview、O1等推理模型,随着RL的持续,模型能力还将不断提升。
可以确定,豆包全面上线推理功能只是时间问题,关键还在于能否打破现有推理能力的限制。
对豆包团队来说,真正的难点不在于推出推理模型,而是比肩甚至推出能超越DeepSeek R1的推理模型。否则,在如今激烈的竞争中,豆包还会处于被动应战的状态。
军备竞赛
AI已成兵家必争之地,尤其拥有资本和人力资源的大厂,更是持续下注。
2月24日,阿里巴巴集团CEO吴泳铭宣布,未来三年,阿里将投入超过3800亿元,用于建设云和AI硬件基础设施,总额超过去十年总和,创下中国民营企业在云和AI硬件基础设施建设领域有史以来最大规模投资纪录。
在阿里之前,字节已经给出了明确的预期,同样是大手笔投入。根据浙商证券报告,字节2024年资本开支达到800亿元,2025年有望达到1600亿元,其中约900亿元将用于AI算力的采购,700亿元用于IDC基建以及网络设备如光模块、交换机。
字节AI方向是基础模型和应用两手抓,公司试图在科技创新与商业化落地的天平上寻找支点。
华尔街见闻获悉,字节2025年的关键词是“务实的浪漫”,要把想象变成现实,相较于科技公司的定位,字节强调要做创新科技公司。年初,字节豆包大模型团队已在内部组建AGI长期研究团队,代号“Seed Edge”,鼓励项目成员探索更长周期、不确定的和大胆的AGI研究课题。
接近字节的知情人士透露,Seed Edge的目标是探索AGI的新方法,鼓励跨模态、跨团队合作,目前初步确定了五大研究方向,包括探索推理能力的边界、探索感知能力的边界、探索软硬一体的下一代模型设计、探索下一代AI学习范式、探索下一个scaling方向。当然字节也在探索应用转化,重点在聚焦新型交互入口开发,涉足AI眼镜、智能耳机等硬件载体;同时,字节强调通过规模效应推动豆包等产品的用户渗透。
据不完全统计,字节在应用端的布局涵盖了助手、虚拟社交、图像等各类场景,应用产品超过20款。去年下半年以来,豆包用户量迅速拉升,并率先破亿。即梦2024年5月上线,目前周活超过200万。近日,即梦还挖来原零一万物PopAI产品负责人,负责移动端业务,向剪映负责人张楠汇报。
值得一提的是,3月3日,中国首个AI原生集成开发环境(AI IDE)Trae 国内版正式上线,配置Doubao-1.5-pro,并支持切换满血版DeepSeek R1、V3模型。Trae对代码补全、代码理解、Bug修复、基于自然语言生成代码等开发过程全场景都有非常好的适应性。
如果没有DeepSeek横空出世,外界对AI应用的关注焦点本在字节系,然而现实已经发生了巨变。DeepSeek把中国AI产业往前带了一大步,也将这场AI竞赛的难度上升了一个维度,给其他模型公司造成了竞争压力,尤其是风头正盛的字节。
算法争议
对字节来说,All In AI既是对未来的布局,也是来自现实的压力。其曾经成功的商业模式,算法分发正在引起更多的争议和不满。
过去十余年间,张一鸣打造的字节帝国凭借“数据-算法-流量”的魔法,在移动互联网时代完成逆袭。这套精密运转的工业化流水线,借由敏捷开发模式精准捕捉用户需求,用数据驱动组织运行,以内部赛马机制激发创新活力。
但字节所依赖的算法,也在一场场舆论事件中成为焦点。
去年11月20日,农夫山泉创始人钟睒睒在出席活动时喊话张一鸣,表示对方把网络变成一种技术算法,在玩弄民众智商。他呼吁:“算法应该明白无误地公布于众。”“对于流量及其谣言以金钱的奖励和激励,把网络变成一种技术算法,变成一种玩弄民众智商的游戏,这是不可以的。”
11月24日,中央网络安全和信息化委员会办公室秘书局联合工业和信息化部办公厅等部门开展“清朗·网络平台算法典型问题治理”专项行动,重点整治同质化推送营造“信息茧房”、违规操纵干预榜单炒作热点、盲目追求利益侵害新就业形态劳动者权益、利用算法实施大数据“杀熟”、算法向上向善服务缺失侵害用户合法权益等重点问题。
字节也作出了回应。12月2日,抖音集团副总裁李亮公开表示:“各大平台都在使用算法,算法并没有那么复杂和神秘。但算法的科普做得不好,透明度不够,同时对于谣言与网暴识别与打击力度不够,这个确实是我们平台公司需要加强的。”
1月3日,抖音宣布将建立安全与信任中心,切实推动算法和平台治理透明化。这是字节第一次明确表态,要将算法的秘密进行公开。
抖音方面表示,将以安全与信任中心为依托,重点介绍社会关切的议题,包括算法原理,审核机制,打击网暴、谣言等平台治理工作。
近日,字节开始披露平台治理进展,2024年,今日头条拦截不实信息超500万条,抖音生活服务处置违规短视频超74万条。
算法争议背后,字节基于算法的短视频业务近年来增速持续放缓。字节投资AI的底气主要来自持续贡献现金流的主业,主业承压无疑加重了字节布局AI的风险。
华尔街见闻从字节内部获悉,2024年抖音电商的GMV约3.5万亿元,增速已经回到30%的量级。为了提升电商竞争力,巨量引擎旗下的电商广告平台巨量千川近日将被整体并入抖音电商,成为其二级部门,同时,分别服务于两个部门的算法团队也被合并。
扛起全球化大旗的TikTok在美国仍面临监管压力,未来发展面临极大的不确定性。飞书、朝夕光年、大力教育等经过上一轮收缩后,目前都比较低调,字节甚至未在全员会上提及这些业务。
近年来,互联网行业普遍进入降本增效阶段,字节整体处于战略聚焦状态,对其他多元业务大举收缩,这也是字节为AI腾挪更多资源和空间的无奈之举。
豪赌未来
字节的AI战略非常坚定,这是张一鸣集全公司之力对未来的一场豪赌。
华尔街见闻获悉,字节内部从资金到人力,都以AI为第一优先级,张一鸣更是不时给出产品建议。
张一鸣去年以千万年薪招揽阿里通义大模型原技术负责人周畅,引发字节和阿里两家公司的纷争。去年底,周畅因违反竞业协议跳槽字节,已遭到阿里起诉索赔。今年初,字节又招揽来了谷歌DeepMind原研究副总裁吴永辉等在内的诸多人才。
去年底,豆包概念股爆火,中科蓝讯、三维通信、掌阅科技等相关公司涨幅一度超过10%。为此,字节跳动12月19日发布风险提示称,资本市场出现炒作“豆包概念股”现象,流传着众多夸大其词甚至是虚构的内容,请投资者切勿轻信市场传言。
估值方面,根据美国证券交易委员会(SEC)去年11月的文件,投资巨头富达投资和普信集团分别将字节估值调至4100亿美元和4500亿美元,高于2022年7月的低点2750亿美元。在业内看来,字节估值上升已经反映了投资者对AI业务的关注。
不过,拼命追赶AI浪潮的字节,也面临财务压力与时间窗口的紧迫性。在全员会上,字节CFO高准明确地说:“公司现在的成本和支出增速要大于收入和利润增速。”
显然,DeepSeek等竞争对手的快速崛起压缩了字节的技术窗口期,迫使公司必须在有限时间内实现突破。字节的试错空间正在收窄。
一位关注AI的投资机构人士对华尔街见闻表示,字节有短视频在内的庞大应用生态,也有火山引擎在内的算力资源,但DeepSeek跑出来主要是因为有足够的创新定力,这是字节需要提升的部分。
早在2021年,字节人数就已突破10万,公司最大的危机感是组织平庸化。今年全员会,字节的重点之一仍是组织管理,对抗大公司病,今年提法换成了 “不官僚、不内卷”,要减少不该有的流程,提高决策效率。
13年前,张一鸣创立了字节跳动,并在五年内接连推出今日头条、抖音、TikTok这三个爆款应用,彼时字节是以创业公司的状态运行,公司人数只有万余人。如今,字节已经是互联网行业巨头,无论是早期对AI前沿技术的判断,还是对推理模型的反应,字节都慢了半拍。
去年底,昆仑万维创始人周亚辉对字节复盘时表示,字节23年AI战略是不及格,但这完全不影响字节 24年AI战略的满分表现。在他看来,字节组织快速迭代能力极强。然而,AI技术正处于快速迭代中,DeepSeek转眼就超过了豆包。
字节用了两年时间才从百模大战中胜出,成为AI顶流,然而公司还没有喘息多久,以DeepSeek为代表的AI技术创新呼啸而来。留给字节和张一鸣的时间,已然不多了。