作者 | 刘宝丹
编辑 | 周智宇
华为盘古、百度文心、阿里“通义千问”……, ChatGPT点燃的大模型之火越烧越旺,“百模大战” 进行得如火如荼,好不热闹。
百度却给火热的市场“浇了盆冷水”。7月19日,百度集团副总裁、深度学习技术及应用国家工程研究中心副主任吴甜对全天候科技表示,大量新的模型出现,只是个阶段性现象。大模型的终局,最终会集中在少量的几个大模型上。
诚然,AI对产业影响越来越深,大模型也给产业结构、社会带来深刻变化,这场人工智能对提升社会、公司效率的变局,刚刚起势。百度创始人李彦宏也直言,人工智能将是第四次工业革命。
包括百度、华为等科技巨头在内,眼下发力的方向都是行业大模型。他们试图成为这些公司运行的基础设施,也抓住公司渴求提升效率的机会,在大模型时代再次对垒。
火热的背后,则是数据、算力的问题横跨在大模型面前,大模型想要赋能行业,找到商业化路径,依旧有一段路要走。
这一系列的难题,让最后能够活下来大模型不多。吴甜也坦言,成本和需求的难题,让大模型最终会走向集中。
成本这关,就是很多资金实力不足的玩家难以跨越的坎。以ChatGPT为例,浙商证券分析师陈杭进行过一次测算,显示支撑其算力基础设施至少需要上万颗英伟达GPU A100,一次模型训练成本超过1200万美元。
而数据决定了大模型的训练质量、性能表现,以及最终应用。
吴甜认为,大模型产业化面临三方面挑战:一、大模型的体积很大,训练难度高,成本高;二、大模型对于算力规模要求也非常大、性能要求非常高;三,则是数据规模大,收集、挖掘、建设、筛选、清洗这些数据,也是非常大的工程。
她表示,大模型成本高昂,训练数据复杂,需要更综合的能力和坚定的信心;另一方面,则是从需求来看,大模型在应用层面未来想象空间非常大,依托少量大模型,会有非常广泛的应用生态。
吴甜把大模型产业模式类比为芯片代工厂,现在芯片的型号、厂商非常多,但代工厂只有几家而已,它把成本高的设备和产线、精密的工艺流程、还有本身生产过程进行封装,有需求的公司只要出生产方案,交给芯片代工厂生产,就可以得到想要的芯片。同样,大模型平台可以把大数据、大算力、大算法都封装,建设标准化的生产模式。
“其实完全不用存在大量的大模型,对于应用者来说,也不需要每个应用都来进行大模型的开发。”吴甜认为,应用方定义好问题,把对AI模型能力要求交给大模型平台,由大模型平台进行生产,最后千行百业遍地开花才有可能实现。
和吴甜有相似观点的大佬不少。小冰公司CEO李笛也认为,“市面上根本用不了这么多大模型,到2024年应该就会退热,会发现谁在岸上谁在裸泳。”
对大模型来说,商业应用才是最核心的点,也是决定未来行业格局的关键。
吴甜表示,在应用层面,大模型未来想象空间非常大。每一个行业都有很大的空间,可以通过新的AI技术去提效。“未来是依托几个少量大模型,有非常广泛的应用生态。”
吴甜认为,下一步,各个企业和机构会逐渐找到自己的定位,逐渐会走向细分方向。
据昆仑万维CEO方汉预测,在未来3-5年内,大模型将产生更多的端到端内容制作工具,彻底改变文学、音乐、漫画、动画、短视频、长视频和影视等行业的内容生产形式和流程。
在金融、电商、能源等行业,百度、阿里和华为等企业,也尝试通过大模型改进这些行业原有的商业模式,他们试图成为这些公司的数据基础设施,帮助企业提升效率。
也许确实如吴甜所说,大模型的终局会集中在少数玩家身上。百度的这盆“冷水”在给行业盲目投入降温的同时,也是希望场内玩家思考清楚,自身发力的方向。
大模型商业化探索才刚刚开始,“百模大战”还战得火热。人们也希望,人工智能带来的“第四次工业革命”,能够对生产效率、生活带来更多改变。在终局之前,仍会有玩家前赴后继,试图从这场前所未有的变革中,找到自己的新机会。