作者 | 刘宝丹
编辑 | 周智宇
如火如荼的“百模大战” 迎来关键一步,即走向市场化发展。
8月31日,百度宣布,文心一言通过《生成式人工智能服务管理暂行办法》备案,用户可以在官网或应用商店下载使用。这意味着,这款最先对标ChatGPT的大语言模型,结束了5个月的邀测模式,正式向公众开放。
不仅是百度,据了解,已公布完成备案的大模型企业还包括字节、商汤、中科院旗下紫东太初、百川智能、智谱华章等7家。
这只是开始,由于公布时间不一,未来还会有更多大模型公司披露备案情况。多家企业对华尔街见闻表示,已首批完成备案提交,但目前没有公布。
阿里云内部人士对华尔街见闻表示,“通义千问”已完成备案工作,待正式上线。他透露,首批通过备案的企业名单,预计将在1周内陆续由各地方相关管理部门通过。
大模型在法律层面完成备案,意味着我国大模型将彻底走出试验区,接受市场公众的反馈和检验,这同时意味着我国生成式人工智能将进入商业化新阶段。
不得不面对的现实是,大模型赛道变得越来越拥挤。赛迪顾问数据显示,截至2023年7月,中国累计已经有130个大模型问世,仅2023年1-7月,就有共计64个大模型发布。
对大模型赛道的投资也在不断加码。年初,IDC在《中国人工智能计算力发展评估报告》中预测,2022年中国人工智能市场相关支出将达到130.3亿美元,有望在2026年达到266.9亿美元,2022至2026年年复合增长率达19.6%。
这也导致大模型赛道产品严重同质化。
据华尔街见闻观察,目前已上线的文心一言、讯飞星火、百川大模型、商量SenseChat、抖音豆包、智谱清言等产品高度相似,都提供问答功能,并具备一定的内容创作能力。
具体来看,智谱清言支持多轮对话,具备内容创作、信息归纳总结等能力;文心一言能够与人对话互动,协助创作;百川大模型也声称在知识问答、文本创作领域表现突出。
随着大模型公司下场抢占市场份额,一场短兵相接的公开赛将不可避免的上演,大模型公司要想成功突围并非易事。
百度集团副总裁、深度学习技术及应用国家工程研究中心副主任吴甜日前对全天候科技表示,大模型产业化面临三方面挑战,除了训练难度高、算力要求大,收集、挖掘、建设、筛选、清洗数据也是非常大的工程。
在驱动人工智能发展的三大要素中,算力和算法更多与企业研发实力有关,唯独数据需要更多从市场中获取。而且人工智能的特点是随着数据量的增长,其获取知识的能力也越来越强,数据堪比生产资料。
这也意味着,数据“填喂”是大模型商业化的前提,谁能获取更多用户,也就有拥有了更多筹码,这也是为什么百度、商汤、科大讯飞、360都在大力宣传自家大模型产品的原因。
百度董事长兼首席执行官李彦宏就表示,当文心一言向数以亿计互联网用户大规模开放服务后,能够获得大量真实世界中的人工反馈,这将进一步改进基础模型。
从这一点来看,时间在很大程度上意味着先发优势,先获取用户并积累更多有效数据,更有利于提升大模型的学习速度,进而掌握发展的主动权。
此外,推出更多应用、深入更多场景也是提高大模型能力的普遍做法,比如,商汤商量通过提供API接口和服务在众多垂直行业实现各类生成式AI应用,百度、科大讯飞等都在不断提高产品的丰富度。
大模型的商业化之路才刚开始,但各家都已蓄势待发。8月30日,360在半年报中公布了一组数据:360智脑已创造近 2000万元相关业务收入。这是国内首个披露收入的大模型产品。
接下来,还会有更多商业化数据出现,总之,大模型的商业化战役打响了。