4月8日,由中国人工智能学会主办的“人工智能大模型技术高峰论坛”主论坛在杭州萧山启幕。
在题为《AI赋能千行百业智能升级》的演讲中,华为云人工智能领域首席科学家、国际欧亚科学院院士、IEEE/CAAI Fellow田奇介绍,大模型是连接技术生态和商业生态的桥梁,是未来AI生态的核心。
华为云盘古大模型推动人工智能开发从“作坊式”到“工业化”升级。2023年盘古大模型重点做好行业应用,为煤矿、水泥、电力、金融、农业、国家云创造产业价值。
要点:
1、华为云过去几年人工智能项目已经应用超过1000个项目,其中30%用在客户的核心生产系统中,平均推动客户盈利能力提升18%,大模型是解决AI应用碎片化的新开发范式,预计大模型浪潮会推动未来几年AI加速渗透。
2、人工智能的发展趋势一个是从小模型到大模型,一个是人工智能与科学计算加速融合。大模型趋势上,不到10年间大模型的算力需求提高了40万倍,算力、资金、技术壁垒迅速上升,将改变AI行业规则和格局,使市场向大型科研机构及企业集中;资本门槛高,大模型开发和训练一次1200万美元;技术门槛高,对AI框架深度优化和超强的并行计算能力。
人工智能与科技计算融合上,AI技术可以提高在气象、海洋、农业、地球、机械、航天、航空、土木、地质等行业海量科学计算的效率,二者相互促进,共同进步。
3、华为云盘古大模型的核心定位是为各行各业进行赋能,分为三个层级。
L0是类似于GPT3这样的基础通用大模型,L1是基础模型与行业数据结合进行混合训练后的行业大模型,已经发布了矿山、气象、药物、分子、电力、海浪、金融等行业的大模型,L2是把L1再具体下游业务场景进行部署后生成的部署模型,如金融OCR模型、电力巡检模型等。
2021年华为发布了盘古NLP大模型、CV大模型和科学计算大模型,后续不断在拓展行业应用,如2022年发布了盘古矿山大模型、盘古气象大模型、盘古金融OCR大模型等。
4、盘古视觉大模型发布时是业界最大的视觉模型,部分场景下成绩位居世界第一。
在矿山场景下,可以在采掘场景上通过5G+AI的全景拼图技术使井下场景传输至地面,在地面进行采掘机器控制;可以在主运输皮带式进行异物检测,识别精准度达到98%;可以对井下作业规范进行监测,违规动作进行预警。
在铁路巡检上,可以帮助检测员进行图像质量的自动评估、小样本的故障定位与识别等,在郑州铁路段测试中,对缺陷和故障监测准确度达到99%以上。
5、盘古气象大模型是全球首个精度超过传统预报方式的AI模型,可以在秒级时间内完成全球未来1个小时到7天的天气预报,精度超过传统数字分析方法的同时预测速度提升1万倍。
盘古药物分子大模型可以提高小分子合成物筛选速度,使过去数年的传统药物研发周期缩短至一个月以内,大幅提高研发效率。
6、盘古大模型针对传统的AI开发难题,比如样本标注大、模型维护困难、泛化能力不足、行业人手短缺等,希望实现低门槛的开发、更强的泛化能力、更高更强的精度,来解决AI应用碎片化的问题。
华为认为未来AI for Industries将是人工智能新的爆发点,基于在华为云上的大数据、大算力、大模型,实现边端云协同,为企业客户、消费者和开发者提供大模型的能力。
如下为演讲内容及现场PPT整理:
从2018年的Bert model3.4亿参数到2020年1月份微软GPT170亿参数,GPT3达到1750亿。去年谷歌发布的PaLM,模型参数达到了5400亿,大模型的数据规模持续提升。
现在人工智能非常火,已经在加速进入千行百业。华为云过去几年中人工智能的项目已经超过了1000个,其中30%的人工智能项目已经进入了核心生产系统,帮助客户盈利能力平均提升18%。我们预计人工智能的渗透率到2026年会达到20%,但是现在迎来了人工智能新的浪潮,因此人工智能的渗透率可能还会大大的提速。
我们从2020年开始,判断人工智能的第一个发展趋势,就是从传统的小模型到大模型的趋势,那么相对于10年前机器视觉领域AlexNet在ImageNet上出色的表现所需要的算力,2020年5月份出现的自然语言的预训练大模型GPT3,算力的需求不到10年的时间增加了40万倍。
另一个发展趋势是人工智能和传统科学计算的快速融合,传统的海洋、气象、地球科学等很多领域目前已经受到了人工智能深刻的影响。
大模型的趋势上,从18年的Bert Model是3.4亿参数,很快到2020年1月份微软的Turing NLG是170亿参数,然后不到半年的时间GPT3的参数达到1750亿,去年谷歌发布的PaLM单体模型参数达到了5400亿,因此我们认为大模型将成为应对AI应用碎片化的新的范式。
首先大模型用海量的通用数据加上行业数据的训练,极大的提升了模型的泛化能力和通用性;另外GPT表现出了极致的性能,因此大模型对于传统的小模型,会收编大量的高度定制化的小模型。
当然市场也会向一些大的研究机构和企业集中,因为训练大模型需要两个关键因素,首先对资金的门槛要求比较高,GPT3训练一次的成本在千万美元量级;另外对算力也有极高的需求,GPT3的模型训练需要1000块A100训练5个月时间;此外对技术的门槛要求特别高,大模型训练因为对成本消耗比较大,所以需要非常有经验的专业人员,要对大模型框架有深度理解,要有很强的并行优化能力的人才行,因此技术门槛高。所以大模型已经在改变AI产业规则和格局。
AI和传统科学计算融合的趋势上,传统的科学计算,像气象、海洋、农业、地球、机械、航空、航天、土木、地质等,主要是是解决很多物理世界的问题,因此基本上是用海量的偏微分方程进行求解,大家熟知的就是大学里学过的麦克斯韦方程、拉格朗日方程、NS方程、欧拉角微分方程等。但是由于传统的科学计算并行度不高,所以对海量问题的计算消耗比较大的,时间比较长。
这两年AI for Science也出现了一些代表性的工作,比如像AlphaFold2对蛋白质结构的预测,谷歌和英伟达DeepMind对AI气象的预测,还有IBM关于局部区域海洋波浪的高度预测,他可以在一个相对较小的地区,给定经度、纬度、风速,去预测波浪的高度。我们华为也发布了很多行业的大模型,用到了气象、药物分子、波浪高度的实时预测等。
AI和传统科学计算的融合还有很多问题要去思考,希望AI为传统科学计算带来新的思路、新的工具和新的方法,也希望传统科学计算能为 AI带来更严密的、在科学的、可解释性的指导。同时也要看在传统科学计算里,人工智能在哪些领域可以发挥重要作用,应该选择怎么样的AI模型,并且也深刻认识到在传统科学计算中还有哪些优点和缺点。
刚才说了大模型成为应对AI应用碎片化的新的开发范式,华为认为大模型是对各行各业进行赋能的重要枢纽。
我们把大模型分成了三个层级,L0就是大家所说的基础通用模型,像GPT3这种。但是把基础通用大模型直接应用到行业中,比如工业质检、遥感影像场景里,达不到最好的效果,因此基础模型还要和行业数据相结合,所以在基础模型L0的基础上,加入行业数据,混合训练得到的L1行业大模型。
然后再把L1在具体下游、千行百业的细分场景进行部署,得到细分场景的部署模型L2。那么为了尽快的降低生产成本、提高效率,如何从行业大模型L1中快速的生产部署模型L2就成为一个非常重要的问题。
华为过去几年主要做了盘古系列预训练大模型,大模型分三个阶段。
第一个叫做预训练阶段,就是用海量的数据预训练我的基础通用模型。第二步是针对下游千行百业的具体任务,用行业数据进行微调,这个叫微调模型或者部署模型。同时为了越用越好,大模型的迭代也是非常重要的,因为新的数据在不断产生,如何把新的数据和之前训练用的数据结合起来,如何实现大模型的增量学习和终身学习,实现模型数据全生命周期的迭代就非常重要,因此第三步是大模型的迭代。
华为从2019年到2021年之间就开始立项做盘古大模型;2021年4月份发布了盘古NLP大模型和盘古机器视觉大模型,当年也发布了盘古科学计算大模型,在2021年9月份,用于药物研发中小分子药物筛选发布了盘古药物分子大模型;到2022年在行业中拓展应用,比如和能源集团合作发布了盘古矿山大模型,到2022年11月份在华为HDC大会上发布了盘古气象大模型;在2022年的HDC泰国上,发布了盘古海浪大模型、盘古金融OCR大模型。
这是盘古大模型赋能千行百业的层次,底层是用一站式AI开发平台ModelArts建立了我们的L0基础通用模型,包括视觉大模型、NLP大模型、科学计算大模型等。在各行各业的矿山、气象、药物、分子、电力、海浪、金融等发布了L1行业模型。再往上是很多细分模型,比如金融OCR模型、电力巡检模型、建筑能耗优化模型等,用在了很多行业。
盘古大模型主要基于一站式AI开发平台ModelArts,这个平台做了大量的工作,包括计算的优化、通信的优化、存储的优化以及算法的优化等等。
在2022年盘古大模型主要是做好行业应用,希望在煤矿、水泥、电力、金融、农业、国家云等方面创造更多的产业价值,帮助客户。
具体有一些应用方向,比如说我们的视觉大模型用到了工业质检上,可以在偏光片流水线上进行质检;可以在铁路TFDS的机车进行缺陷检测;还可以做电力巡检,无人机每天会拍摄海量的照片,如何快速筛选有缺陷的样本,过去传统用几十个小模型来做这一步,现在希望用一个统一的大模型能够加快筛选过程,提高筛选质检质量。NLP大模型上,去年交付了阿拉伯语的千亿大模型,后面在访谈上取得了比较好的成绩;在类案检索上,在智能技术评测中取得了第一的成绩。在科学计算上,发布了气象预测的模型,和海浪的实时预测模型。
具体讲几个应用案例。第一个是盘古视觉大模型,是2021年4月份在华为HDC大会上发布的,发布的时候是业界最大的视觉模型,有30亿参数和10亿级别图像,已经在100多个场景得到了验证,在ImageNet的1%、10%设置的分类结果达到业界第一。
机器视觉现在面临的挑战,第一个挑战就是语义信息高度稀疏,虽然左边两幅图像非常简单,第一个图像代表是蓝天、草原的概念,第二个数学公式也是非常简单的,但是存储语义信息时图像所需要的空间是远大于语义存储的空间,因此挑战在于需要从图像中去提取信息密度更高的语义特征。
应对这样的问题,主要从两个方面来考虑,一个是与图像本身属性有关的,比如说它是医疗图像、工业质检图像或者遥感图像,通过大量的预训练来实现的;另外一个是跟模型相关的,比如说任何一类图像,你是关注它的局部特征还是全局,因此对应设计transform架构还是其他架构,这是通过模型设计来完成的,因此针对信息高度稀疏的问题解决办法就是通过神经网络架构设计和预训练来做。
另外一个挑战是域之间差异大,右边两张图表达的语义都是选手骑在马背上,但是由于图像的采样方式、远近视角不一样,因此如果用左边的图像来做训练,再用到右边的分类上,可能模型的性能就会下降很多,这就是图像域之间差异较大的挑战。
解决办法是通过域迁移的方法,做针对下游的具体场景的针对性的微调来提高精度。同时由于有些下游任务面临着数据短缺、数据量少的问题,因此要做到高效的微调。这就是大模型的这样的预训练加微调的新的开发方式。
视觉大模型已经用到了很多的案例上,第一个是和能源集团合作发布了华为盘古矿山大模型,矿井下有一个40米长的采掘机,它的采掘钻头直径2米左右,传统的阵列式相机很难一下子捕捉到全景,因此传统是九宫格的视频画面,现在通过5G加AI的全景拼图技术,把它拼成一个实时的视频或照片,通过5G传输到地面,让地面的工作人员将来可以实现在地面控制机器进行采掘的过程,实现矿下少人无人。
视觉还用在了煤矿的主运输皮带上的异物监控场景,煤被采掘下来以后会通过一个主运输皮带从地底下传输到地面上,这个皮带有几十公里长,传统的方法是通过工人的人工巡视来发现传输带上的异物,如果说在传送带上出现了一些异物,比如说铁丝或者锚杆,卡住了皮带轮就会导火花火灾等风险,现在我们矿山大模型做的监控可以让异物的识别精度达到了98%。还可以通过视觉技术对井下的安全作业规范进行检测,如果掘进动作不符合标准的话,进行实时的预警。
第二个是把盘古的视觉大模型用在了铁路轨道机车上面的缺陷检测,机车上会出现吊链、脱落、裂痕等潜在不安全因素,过去是通过动态检测员来对图像进行人工的检测,人工成本比较高,过去比如说全路有6000个动态检测员,人工强度也是比较大的,现在希望部分的减轻他们的工作量,那么盘古大模型提供了这样的核心能力,包括图像质量的自动评估,小样本的故障定位与识别等等。在2021年9月到10月,在郑州铁路段收集的32000多样本的评测中,我们对缺陷和故障检测的准确度达到了99%以上。
科学计算大模型上,AI和科学计算在模型、算法、软件、硬件4个方面加速进行融合。
我们在2022年的 HDC大会上发布了华为云气象大模型,它是一种3D高分辨率的AI气象预报方法,是全球首个精度超过传统预报方式的AI模型,传统是通过数字分析的方法,排在世界第一的是欧洲气象中心,盘古可以在秒级的时间内完成全球未来1个小时到7天的天气预报,精度首次超过了欧洲气象中心的数字分析的方法,并且预测速度提升了1万倍以上。
用在自然灾害里面,比如说像台风轨迹预测上,盘古的精度相对于欧洲气象中心的方法提升了20%以上。盘古气象大模型相对于业界的英伟达和欧洲气象中心的AI气象模型都有提升,预测时间从过去的6个小时提升到1个小时做一次预测;空间分辨率,除了海平面上的预测,我们把空间从比海平面到高空做到了13层,将来随着我们继续的训练,可以把空间精度做到37层,甚至做到200层;对于温度预报、气压的准确度等,都有明显的提升。
另外一个就是药物分子研发上的小分子合成物的筛选方面,让传统的药物研发周期从数年降到了一个月甚至一个月以内,大大提高了研发效率,发布了华为云盘古药物分子的模型。
我们还把它用到了空气质量优化上,帮助合作伙伴在电力能耗上的消耗降低了15%,并且对于空气中的,比如说会场或者会议室里面的二氧化碳、甲醛的浓度预测都有了很大的提升。
我们现在的盘古大模型针对传统的AI开发难题,比如样本标注大、模型维护困难、泛化能力不足、行业人手短缺等,我们希望实现低门槛的开发、更强的泛化能力、更高更强的精度,来解决AI应用碎片化的问题。
展望未来,我们认为AI for Industries将是人工智能新的爆发点,基于我们在华为云上的大数据、大算力、大模型,实现边端云协同,为我们的企业客户、消费者和开发者提供大模型的能力。
项目初始投入约20亿,远高于电化学(3.6-4亿)。但成本下降空间较大,根据IRENA预测,到2030年G
本文综合自新浪科技、证券时报、每日经济新闻等。