本文作者:张逸凡
编辑:申思琦
来源:硬AI
百度,一家在PC时代崭露头角的科技巨头,面临了在移动互联网时代的挑战和竞争,似乎未能完全抓住时代的机遇,相比于其他科技公司在这一阶段的快速发展,百度显得有些落后。
随着时间进入人工智能(AI)时代,百度希望能够借此机会弥补过去在移动互联网时代的失地,重新确立自己在技术领域的领导地位。
在刚刚结束的百度最新财报会上,公司透露了AI业务的最新进展:
• AI云服务营收同比增长12%;
• 百度搜索11%内容由AI生成;
• 大模型API调用量激增:近五个月,从5000万增长至2亿;
• AI模型性能大幅优化:训练效率提高到 5.1 倍,推理成本降低到百分之一;
百度董事长兼首席执行官李彦宏在电话会中表示,公司正在从以互联网为中心转向人工智能优先,推进用文心大模型重构To C和To B业务。目前,文心大模型日均处理Tokens文本约2500亿,日均调用量2亿次。
李彦宏特别强调:搜索最有可能成为AI时代的“杀手级”应用(killer app),而百度搜索的AI重构工作仍处于早期阶段。
此外,百度CFO罗戎称,在未来几个季度,百度将继续支持AI业务高质量增长。公司认为,随着中国生成式 AI 的新时代展开,将为百度带来更多机遇。
一、“All in AI” —— 百度的新机遇?
为了实现李彦宏“以互联网为中心转向人工智能优先”这一目标,百度正大力投资于AI技术的研发和应用,特别是在自动驾驶、深度学习、自然语言处理等领域。
百度正试图抢回在移动互联网时代失去的阵地。
• PC时代,凭借着独特的搜索引擎技术,百度成为了国内的搜索龙头;
• 移动互联网时代,用户流量从PC端转移到移动端,公司虽多方位布局,但相较于腾讯/阿里仍显逊色;
• 在推荐算法时代,又大幅落后于字节信息去中心化模式;
• 迈入AI时代,百度基于其在AI领域拥有的深厚积累,希望能够在此浪潮中突围;
AI效果在财报中已逐渐突出,今年一季度智能云业务的收入达到47亿元,同比增长12%,来自生成式人工智能和基础模型的收入占智能云业务收入的6.9%。
二、AI云服务,从芯片到平台
2016年,百度CEO李彦宏提出“AI+云+大数据”的云服务战略。
此后,百度智能云构建了“芯片—框架—模型—MaaS平台”的全栈式AI基础设施,这一基础设施支持从数据存储到模型训练、部署、运行的全链路AI服务。
值得一提的是,百度飞桨平台已经兼容了50多种不同芯片,许多是本土设计的,开发者社区已经增长至1300万。
这种AI基础设施布局模式,也让百度在受制外部环境情况下,更好的匹配国内AI云需求。李彦宏认为,这种模式使得百度能够将不太先进的芯片用于高度有效的模型训练和推理。
李彦宏在电话会中称,百度把来自不同供应商的GPU集成到统一的计算集群中,以训练大语言模型,“我们的平台在GPU集群上展示了非常高的效率,该集群由成百上千的GPU组成,这是在进口GPU受到限制的背景下取得的重要突破。”
1)自主研发芯片
公司自主研发了 AI 芯片(昆仑)和语音交互芯片(鸿鹄),用于优化语音、自然语言处理、图像等 AI 技术,并支持公司的深度学习框架。
芯片最新进展:
• AI芯片:迭代到昆仑2,相比昆仑1代性能提升了2-3倍,提供128TFLOPS算力,内存带宽512GB/s;
• 语音交互芯片:迭代到鸿鹄900,较上一代鸿鹄818芯片,CPU性能提升200%,GPU提升160%,搭载于华为智慧屏V5 Pro;
2)深度学习框架 —— Paddle Paddle
Paddle Paddle是百度基于BERT自研的深度学习框架,集成了深度学习核心训练和推理框架、基础模型库、端到端开发套件和丰富的工具组件。
该框架服务企业遍布能源、金融、工业、医疗、农业等多个行业。例如,连心医疗基于PaddlePaddle平台开发的“基于CT影像的肺炎筛查与病情预评估AI系统”已在湖南郴州湘南学院附属医院投入使用。
Paddle Paddle采用了开源的形式,方便百度更好的建立自己的AI生态圈。
根据公司披露的信息:
• 截至 2024 年 4 月中旬,PaddlePaddle 开发者社区已经拥有了 1300 万名成员;
• 截至2023年底, PaddlePaddle 为 23.5 万家企业提供服务,开发社区已经创建了 86万个模型;
此外,数据显示,Paddle Paddle 在 Github 使用人数、贡献者人数和技术迭代速度上,仅次于海外一线平台 Pytorch 和 TensorFlow。
3)AI大模型 —— 文心系列模型(Ernie)
基于强大的基础模型(Paddle Paddle),百度研发了文心系列模型Ernie(有趣小故事:文心一言的英文名为“Ernie”, 源于美国儿童节目《芝麻街》中的角色的名字,而节目中Ernie的好朋友正是Bert,Bert是谷歌2018年发布的AI模型)。
目前迭代至文心 4.0,参数规模可能超1万亿,约为文心 3.5 的4-5倍。
根据公司披露,截至今年4 月,文心模型每天处理的 API 调用约为 2 亿次,远超去年 12 月的约 5000 万次调用,表明百度文心模型正被越来越多的人所采用,并预示着未来模型推理具备强劲的收入潜力。
此外,为了让模型更具性价比,公司通过独有的四层人工智能架构和强大的端到端优化能力,不断提高模型的效率。与 3 月 23 日的版本相比,文心模型的训练效率提高到 5.1 倍,推理成本降低到百分之一。
4)MaaS(AI开发云平台)
为了让开发者更简单的开发AI模型,百度在云平台上提供了三套工具:
• AppBuilder 和 ModelBuilder:供企业和个人开发者开发应用程序和搭建模型;
• AgentBuilder:可以轻松创建一个AI Agent;
盈利方面,百度从 2022 开始将业务重点放在提升 AI 智能云业务的利润率上,废除了低质量业务,同时致力于为不同行业的客户定制标准化 AI 解决方案。
24Q1的业绩会上,公司表示,智能云收入增长主要由生成式 AI 和模型训练驱动。目前,大部分收入来自模型训练,但来自模型推理的收入增长很快。
展望未来,百度认为模型推理是最重要的长期机遇之一,也是未来人工智能云收入的主要增长动力。
三、“AI+”业务赋能
AI技术在百度内部广泛应用于搜索引擎、信息流推荐、百度翻译等多个领域。在电话会中,李彦宏对未来AI赋能搜索支柱业务信心更足,认为搜索是AI时代最可能成为杀手级应用的产品:“AI搜索能使用户能够做到以前做不到的事,并且百度暂时还没打算对这部分收费。”
去年第二季度开始,百度就已经使用文心一言重建百度搜索,现在越来越多的搜索结果是文心一言以不同格式如文本、图像、第三方链接等组合而成的。
在模型构建上,百度使用了3种轻质模型和2种针对特定任务的模型,并且搭配专家混合模型,用来给大模型分配任务,在性能和成本上找到了更好的平衡。
从数据上看,AI确实正在提升百度各个业务的效率:
1)AI+百度搜索:截至24Q1,百度搜索有11%的内容由AI生成,同时,AI搜索推动了广告收入的增长;
2)AI+百度文库:通过引入生成式AI功能,吸引了18%的新付费用户。这些功能包括内容总结、创作、扩展以及将灵感一键转化为Powerpoint等。24Q1 百度文库付费用户数量实现了两位数的同比增长。
3)AI+百度地图:引入了“AI向导”功能,在理解用户需求的基础上,智能调用众多地图功能及服务,快捷准确地给出解决方案;
4)AI+百度网盘:推出了基于文心大模型的智能助理“云一朵”,帮助用户实现一句话快速搜索文件和视频、总结知识、翻译文档、甚至进行内容创作的功能。 截至23Q3“云一朵”的用户已达到2000万。
四、终端厂商合作 AI手机/AI PC
AI除了对内提升效率,本季度百度也进一步扩大了对外合作。
根据公司披露,上季度,公司已与三星中国、荣耀等手机厂商达成合作。本季度,合作扩展到更多领先智能手机厂商,包括Oppo、VIVO和小米。
业务范围也从智能手机扩展到PC和电动汽车领域,进一步扩大了百度的AI生态圈。联想正利用Ernie API为其默认浏览器中的AI助手提供支持,蔚来汽车开始使用Ernie API增强车内体验。
此外,公司吸引了许多新客户,包括携程、高途、招聘、作业帮和新加坡旅游局,通过AI技术,帮助他们重构所有面向消费者的产品,以提供更好的用户体验。
五、对外投资
除了自主研发,百度也通过对外投资来不断扩展自家的AI生态,覆盖了芯片-模型-模型应用三大环节。但很明显,与阿里不同,百度的对外投资更偏向于上下两端。
这个原因也不难理解,因为百度未来将依靠搜索这类应用端支撑收入,完成商业模式闭环的。
最有代表性的一个证明来自李彦宏对大模型开源还是闭源的判断:“大模型开源意义不大,闭源才能走通商业模式,是能够赚到钱的,能够赚到钱才能聚集算力、聚集人才。”
“闭源在成本上反而是有优势的,只要是同等能力,闭源模型的推理成本一定是更低的,响应速度一定更快”,这也是与阿里云不同的商业模式的思考。
所以,按照百度的思路,未来的路已经比较清晰,但AI时代的竞争显然会比PC时代更加激烈。
本文来自微信公众号“硬AI”,关注更多AI前沿资讯请移步这里