张宏江:AI大爆炸至少将持续十年

深网
张宏江认为,AI过去的十年是积累的阶段,今天会看到一个大爆炸的时点。这个大爆炸实际上是在深入到每一个可能的应用场景里面去。

人工智能未来会超越人类智慧吗?如今AI行业在这个问题上已基本达成共识。

北京智源研究院给出了通用人工智能(AGI)的释义:一定是比人类强大的智能,才真正叫AGI。所以,自主智能、超人智能、强人工智能,其实讲的都是一种全面超越人类的智能。

于是当生成式人工智能(GAI)模型ChatGPT诞生,沉寂已久的AI行业再度沸腾之时,关于人工智能安全的集体思辨随之发生。

“历史上从来没有过更智能的事物被不那么智能的事物控制的先例,假如青蛙发明了人类,你觉得谁会取得控制权?是青蛙,还是人?”——AI教父、图灵奖得主、“深度学习三巨头”之一Geoffrey Hinton;

“想象一下,未来的AGI系统或许具有10万行二进制代码,人类监管人员不太可能发现这样的模型是否在做一些邪恶的事情。”——OpenAI CEO Sam Altman;

“我们应该暂停开发比GPT-4更强大的系统,不是说我们应该暂停人工智能,暂停的目的只是让人工智能更像生物技术。让机器具有可解释性是关键。”——“暂停AI研究倡议的发起人”、 现任麻省理工学院物理学终身教授Max Tegmark;

这些观点摘录自堪称全球最高规格的AI行业大会“智源大会”。今年6月,出席第五届智源大会的嘉宾包括4位图灵奖得主:Geoffrey Hinton、Yann LeCun、Joseph Sifakis和姚期智,OpenAI CEO Sam Altman,张亚勤等知名院士学者,以及DeepMind、Midjourney等知名人工智能团队。

主办方智源研究院,是一家在舆论场上极为低调的人工智能非营利研究机构。2018年,即OpenAI第一代GPT大模型发布次年,智源研究院成立。成立之初,智源研究院的目标清晰而庞大:深挖人工智能,产生多项在20年后回看仍有意义的原始创新成果。

张宏江是这场“豪赌”中被寄予厚望的灵魂人物。他做过研发,做过管理也做过投资,被熟知的身份是金山集团及金山云CEO、微软亚洲研究院创始人之一。张宏江被业界称为计算机视频检索研究领域的“开山鼻祖”,是世界计算机领域影响因子最高的科学家之一,现任美国国家工程院外籍院士。

“宏江是最早一波将科研落地进入产业的科学家,这二十年培养了不少人工智能人才。”小米科技联合创始人黄江吉告诉《深网》;前字节副总裁、现清华大学智能研究院首席科学家马维英向《深网》表示,“宏江是全球范围内少有的能将学术和产业都做到一定水平的科学家。”

张宏江一直对年轻人充满信心,“一代比一代强,他们的包袱比我们身上的包袱少,有自信,知识面比我们宽,全球的视野比我们在他那个年纪的时候要强太多。”

出任智源研究院理事长后,张宏江从零开始聚沙成塔,搭建团队。2020年,智源成立大模型攻坚团队,2021年推出了“悟道2.0”大模型,参数量达1.75万亿,是GPT-3.5的近10倍,是当时中国首个、全球最大的万亿级模型。今年6月智源大会上,智源发布了完整的悟道3.0大模型系列(包含语言大模型系列、大模型语言评测体系、视觉大模型系列、多模态模型等),并进入全面开源阶段。

“我是所谓出道(退休)了的人,我不需要为了自己的位置而做一些事情,我不会再做一些重复的事情。”在接受《深网》专访时,张宏江称把研究做出来是智源研究院的方向,“不能是为了出几篇文章”。

张宏江在《深网》采访中直指人工智能研究的问题,从根源上回答了为什么是微软抓住了此次人工智能浪潮的机会。张宏江认为,基础研究,要么不做,要么一定要把它当慈善来做,就不要想短期的回报。

“我们要问,有没有环境能够容忍科研者在低潮的时候做一些事情。反过来也要问自己,我们的科研从业人员有多少是出于对他做的事情的热爱?”

张宏江认同《为什么伟大不能被计划》一书中的观点,探索任何复杂问题的过程都将充斥无数欺骗性的“踏脚石”,目标可能是错误的指南针。“一切努力都是为了提高概率。资助机构经常问我一个问题,五年内你能实现什么?我不能保证我能带来什么,但我成功的可能性会增加。”

过去三年,《深网》与张宏江博士多次对话,话题涉及基础科学研究、大模型、人才教育、AI技术大爆炸等。以下为《深网》与张宏江的对话实录,在不改变原意的基础上有所删改:

01 “把基础研究当慈善来做”

《深网》:为什么是微软抓住了人工智能的机会?

张宏江:核心的核心是,我们不能每次在一个风口来过后,我们看到一些成功者,就想问为什么我当时没做到?为什么中国没有做到?为什么清华或者北大没做到?

我们要问,有没有环境能够容忍这些人在低潮的时候做一些事情。反过来也要问自己,我们的科研从业人员有多少是出于对他做的事情的热爱,有多少只是当成一个职业?

神经网络实际上是上一波人工智能热潮里的核心算法。在80年代末90年初开始技术退潮的时候,人们开始排斥或者说放弃神经网络的相关研究,开始转向统计学习。这本身不是坏事,当时神经网络确实没法往下走,研究一定是会走很多弯路。

当时没有人再投资神经网络,但杰弗里 · 辛顿(Geoffrey Hinton)(谷歌副总裁兼工程研究员、Vector研究所首席科学顾问、多伦多大学名誉教授,亦是伦敦大学学院(UCL)盖茨比计算神经科学中心的创立者。深度学习“三巨头”之一)并没有放弃,还在持续做这件事。

而杨立昆(Yann LeCun)(法国计算机科学家,担任Facebook首席人工智能科学家和纽约大学教授,2018年图灵奖得主,被称为卷积网络之父。深度学习“三巨头”之一)读博士的时候恰恰是上一轮AI泡沫破灭的时候,他并没有受到影响,还是持续研究神经网络。

如果我们看杰弗里 · 辛顿(Geoffrey Hinton)或者是杨立昆(Yann LeCun)这样的人,我们应该从他们身上学到的是,他们对于自己所做研究的热爱,不会因高潮低潮而改变。

当职业成本太高就难有突破性的东西。但这是一个生态的建设,我们希望智源能持续为良性循环的生态做出贡献。

《深网》:这意味着科研者要在理想和现实二者间进行抉择?

张宏江:我们已经不是陈景润时代,做科研要自己挤在一个角落里,既没有好的办公室,也没有好的生活条件。

一方面我非常同意要大力提高科研人员待遇,另一方面我想强调,科研人员的第一选择应该是比较自由开放的环境。自由和高收入在市场上往往会存在一定矛盾,但是否要随波逐流,成为不断追求短期市场回报的那一批人,在于每个人的选择,正是无数的选择写成了我们一生的成果。

智源在一开始研究OpenAI的时候有一个分析结论是,(他们愿意做因为)他们工资高,平均(年薪)25万美金。但我告诉团队,OpenAI的这些人如果去Google的话,他能拿50万美金。这波人是有理想,真的想做这件事的,至少他们愿意为这种情怀拿出三年五年。

《深网》:为什么是三年五年?

张宏江:我们不能要求一个人一辈子都有理想,或者一辈子靠家里生活。

《深网》:大公司平台化产品追求快速迭代,但科研不能功利化?

张宏江:产品和公司一定是这样追求。但我们做研究,如果大量的工作就仅仅为了在自己简历上多放几篇文章的话,实际上是一种浪费。大部分文章,其实读的人都很少。真正的价值应该如何体现?这是值得科研人员好好思考的问题。

《深网》:看起来商业公司并不适合做基础研究。

张宏江:没有,关键是这些公司要想清楚,公司的定位以及公司的利润想拿来做什么。

有人曾经来微软研究院问我,什么是最好的体系?我说基础研究,要么不做,要么你一定要把它当慈善来做,就不要想短期的回报,不论政府还是企业。管理基础研究人员也不能像管工程师那样,看每个礼拜都做了什么。

如果我们太多时间花在短期的考核上,我们没法做事。

微软在1993年做微软研究院的时候还是家小公司,但比尔·盖茨其实想的很清楚,他就希望微软研究院找最聪明的人做他们想做的事,这种理念让微软研究院能够做成。

微软研究院的一些技术对微软产品也有贡献,但微软研究院是完全像一个大学的计算机系进行管理的。比尔·盖茨喜欢看到一些新的技术,他考虑过商业后也觉得,微软能够每年拿出几亿美金来做这件事,不求短期回报。

《深网》:给予研究人员充分自由的环境后,他们是否会出现迷茫以及找不到锚点的问题?如何解决?

张宏江:之前我在国内一个顶尖大学和青年教师做过一次所谓的职业讨论,一位年轻的教授提出一个问题:我们一方面有KPI的要求,要申请基金、出文章、评奖,另一方面我们也知道真的要做突破性的研究需要聚焦,需要很长时间沉下去,这两个矛盾怎么平衡。

我说,如果这个问题是国内三流学校的某位教授提的,我会非常同情他,给他出各种各样的主意。但我们一流大学的教授不应该提这样的问题,你要对自己充分的自信。

如果你相信自己是一流的人才,又获得了一流的资源,你不应该去畏惧失败,事实上失败的几率没有那么大。作为管理者,如果你认为这个人是一流的人才,你就应该放心大胆的让他做决策。科研体系里面的信任非常重要,当我们互相有信任的时候,不应该再纠缠于失误的可能。

KPI就是唯数字论,最后一定要数字过关。这个我觉得不光是科研体系的问题也是很多管理体系的问题。

因为管理人的能力不够或不够专业,所以一定要用数字来考察大家。比如你要有多少论文,论文还分哪个档次的论文。但我们做事情,尤其是做科研不能这么做,你需要有很多的探索,很多的失败。先有大量的失败,才可能有比较好的成果,这也是我这么多的年做科研管理的一些心得。

《深网》:您是否会划定容错率?

张宏江:做研究和做产品不一样,做产品失败了就是一个失败的产品,但做研究比如你失败100次,只要做出一个足够改变世界的东西,那你就成功了。你不可能定KPI,说10个项目我要成功7个还是成功3个。

《深网》:评价一个东西是否有价值,有没有可以量化的指标?

张宏江:不用量化。第一你是不是在最前沿?第二你是不是在做别人以前没有做过的事情?第三你是不是有最好的人去做这件事?我们谈科研一定是说要对这个问题有好奇心,听上去好像比较简单,但你看中国科研的问题在哪儿?职业化,就是做科研是职业不是爱好。

职业化就会被KPI推动,而不是被想解决问题的冲动推动。我们找人格外看重三点,第一要找因好奇心和解决问题冲动而推动的人,第二是有深入理解问题能力的人,第三是有团队能力的人,这样才能做大事情。

02 “AI创造的工作会比消灭的更多”

《深网》:您认为我们现在处于AI技术发展的哪一个阶段?

张宏江:AI过去的十年是积累的阶段,今天会看到一个大爆炸的时点。这个大爆炸实际上是在深入到每一个可能的应用场景里面去。这也意味着AI的门槛在降低,或者说AI本身变成一个基本的技术能力。

所以我也不认为大学里设人工智能系是件特别好的事。它已经成为一个基本技能的话,计算机系的学生都要学啊。就像你今天在计算机系要学系统架构或者学数据库,你不会再设一个数据库系,或者系统架构系。

《深网》:大爆炸期会持续多久?

张宏江:最少10年。

《深网》:李开复不支持将AI比喻为类人脑,认为人类对人脑的了解太少,您认同吗?

张宏江:我们不应该把今天的人工智能、深度学习说成是类人脑,或者是像人脑一样思考,确实不是。今天的AI不是人脑这种思维方式的一个很重要的原因,是我们对人脑的认识很少,所以我们更应该去学习人脑。

《深网》:OpenAI部分前核心人员在2021年新成立了一家公司Anthropic,目的是解决AI的安全问题。他们认为“研究者们正在疯狂地把一些‘一知半解’的知识用于神经网络,并且把这样开发出来的AI系统用于越来越高风险的场景,却又缺乏对可解释性,对安全的思考。”您怎么看这个观点?

张宏江:对于这个技术判断我不太想多说,我本人未必能够做出更好的判断。但我想说的是,他们从OpenAI出来,做新的公司探索新的方向,新的方法论,本身就是他们产业科技界创新能力的体现。他这个东西现在不是主流,但可能10个里面有3个或者有1个会成为主流,我也希望中国多出现这种非主流的探索。

《深网》:智源设有AI伦理中心,您怎么看AI的安全问题?

张宏江:好消息是AI的伦理和安全这件事在中国已经变得非常popular,大家已经认识到这个问题很重要,反而我们自己并不需要花太多时间来做这件事了。

《深网》:未来的AI发展将会给人类社会带来怎样的根本性变化?

张宏江:尤瓦尔·诺亚·赫拉利(Yuval Noah Harari)写过一本书叫《未来简史》,他想强调的是技术的发展会导致人类的分化,一些人会永远落在技术后面成为所谓的弱者,或者说闲人。

他这个说法可能有点夸张,但我觉得我们是时候来考虑这个问题了。当技术发展的速度超过人的学习能力的时候,他的工作会被机器所取代,如果不转变就不可能再找到另外的工作。

《深网》:是必然会发生的吗?

张宏江:必然的。从工业革命到现在信息革命,新技术满足的精神需求越来越多。Facebook不生产任何衣服也不生产任何粮食,但他的公司营收比任何一家做衣服或者做粮食的公司都要多。

技术所带来的两极分化可能最终会导致经济上的两极分化变得越来越厉害。

我们现在想想为什么这么多人反对全球化。完全的全球化意味着这个世界上这一份工作只要在另外一个地方比你这个地方便宜,这份工作就会在这消失。按这个思路想,机器人时代这份工作只要有个机器人能做,这个工作就会消失。

但一方面我们不可能停止或者拖慢技术的发展,另一方面人们的适应和学习能力也不太可能加速。这个矛盾未来怎么解决?这种挑战用传统的方式可能解决不了。信息技术出现后,新产生的工作比他消灭的工作要多,技术发展能够自己把这个问题解决掉。

《深网》:技术发展会带来世界秩序的重建吗?

张宏江:当大部分变成闲人的时候,社会秩序必须得重建。这种秩序未必是国家的变化,但经济体系是一定要变的。

“大模型是一个系统问题、工程问题”

《深网》:当初为什么会做智源研究院?又为什么会拍板做大模型?智源的悟道大模型是中国首个,也是全球最大的万亿级模型。

张宏江:当初北京市提出一个想法就是怎么能推动AI基础生态建设,吸引人才、出成果,包括科研成果和产业成果。

我自己的想法很简单,我不认为我们可以比清华做得更好,短期内也不觉得我们有资源和能力再做一个类似微软研究院或中科院的研究院。

AI走到今天,我当时很清晰的想法就是大数据驱动大系统,我相信计算机是一个系统科学,所以我们一定要做大模型、大系统。今天的突破进一步证明了我的直觉。

大模型是一个机会,生命模拟是一个机会,AI+科学是一个机会,这三个方向的研究我们现在都在做得越来越实。

人工智能经过10年的发展至今,我们已经不能再把它看作一个纯算法问题,它一定是一个系统问题,一个工程问题。今天的大模型本身就是一个系统问题、一个工程问题。

《深网》:所以说不能仅靠算法工程师?

张宏江:对,这已经完全变成系统工程。你看大模型的代表性文章,就是GPT-3那篇文章,三十几个作者,包括工程、算法、数据等方面。不光需要懂深度学习的,还需要懂计算机架构、训练架构、计算机平台的。

《深网》:如何将不同细分领域的领军学者揉成一个有凝聚力的团队?

张宏江:做大模型、大系统,我们需要一种新的组织结构。传统的研究院架构没法做成GPT-3大模型这种事。

传统研究院,会按照不同领域不同研究方向招人,然后按专业各自分组,每个组都有一个manager,很容易变成一个孤岛。

因为每个人都觉得自己目前做的那个问题很重要,都想往前走,然后互相做的就是抢资源。

智源研究院恰恰不是这么来组织的,不一定要用院里的研究员,而是看大模型研究需要什么能力,再去找相关领域的领军团队。

《深网》:大模型需要集中力量办大事,但很多企业更想把核心技术掌握在自己手中,智源怎么解决这个矛盾?

张宏江:大的平台企业,他们一定是希望什么东西都自己做。我们希望给那些中小企业提供技术支持。他们没有能力自己做,也不希望大的平台公司在这方面形成垄断。

OpenAI成立之初的使命就是不希望AI被几个巨头垄断。我们也希望推动技术本身的发展,让很多中小企业不要因为当前能力的局限而错过一些机会。我们提供技术,公司进行工程化和产品化。

《深网》:您一直强调您成立智源并非是脱离退休状态回到台前,为什么坚持做幕后的角色?

张宏江:我的精力和聚焦的能力都不允许我在一线,还是应该让年轻人来做,功成不必在我。

而且你发现年轻人的悟性和学习能力都比你强,也确实没有必要在前面挡着别人。35岁以后,你的经验会开始弥补你的创造性。所以这时候,你把自己的心态和精力调整一下,去支持年轻人,让年轻人的研究变得更加有效,其实也很好。

《深网》:科研纠错成本高,引路人很重要。

张宏江:我回国的时候已经39岁了,当时带着团队一拨20多岁的博士生和博士后,大部分工作是他们做出来的,但反过来问他们当时在学校为什么做不出来同等的成绩?引路人、鼓励他们的人或者跟他们讨论的人很重要。

今天我们中国的科研投资如此之大,我们做计算机的科研人员如此之多,而我们还没有在计算机领域成为世界领军。不是年轻人不够努力或者年轻人不够强,50岁以上的这拨人也非常关键——他们是否还能保持对事业的热情?他们当初选择这个行业是因为成绩好,还是因为热爱?

今天我们老一辈学者如果还在读论文的话,证明他还保留好奇心和热情,再加上他们的经验,他们一定能跟年轻人搭起一个非常好的团队。

年轻人非常强,再过20年他们一定会是世界领军。

《深网》:您曾说不能跟风做研究院,在您看来如今的人工智能研究院与20年前的软件学院有什么不同?

张宏江:第一点,教育的本质不是说教会学生人工智能的某一门技术,也不是教会深度学习的某一种调参方法,那可以叫职业学校来做。大学一定是培养人的学习能力、认知能力、思考能力、批评能力。

第二点是技术本身是永远变化的。50年前大学里最吃香的专业是化工,30年前是电子工程,今天是人工智能。

任何一个热门的东西过了5年后都会不热。5年后这个风过去了,人工智能这个系撤掉还是不撤掉?为什么不能在计算机系或者电子工程系里多开一些人工智能的相关的课程?就像现在软件学院做的事情跟计算机学院没有什么区别了。

03 “任何一个热门的东西过了五年后都会不热”

《深网》:科学家如何成功转型为企业家?

张宏江:我始终不认为我自己是一个特别成功的管理人员,更不是成功的企业家。

就转型的话,我在微软后几年也一直在做产品研发的管理,也看过一些产品销售的问题,到金山做CEO,这中间并不是一步跳过来的。

《深网》:但雷军曾三顾茅庐请您出任金山CEO,他曾说他看中您是因为觉得您的领导力很强。

张宏江:我们不管别人怎么说,我对自己有自己的认识。我们不应强求自己一定要为了跨界而跨界。一个人的最佳状态就是能在自己喜欢的事情上持续保持热情,持续做出成果。我本身之所以去产业界,其实是源自我对于挑战的渴望。

《深网》:科学家、CEO、投资人这三重角色在您做智源研究院时是否带来了不同的视角?

张宏江:在智源研究院理事长这个身份上,三种角色会随机跳转。我们在计划和衡量一个研究题目的时候,我完全是学者的态度去看这个题目本身的学术价值、突破的可能性有多大,不会看商业价值。而如果在评估一个科技成果转化项目时,我会把所有的学者思维抹掉,你要告诉我三年以后怎么赚钱。

我非常喜欢跟年轻人在一起。我的乐观情绪来源于,我们真正看到一代比一代强,他们的包袱比我们身上的包袱少,有自信,知识面比我们宽,全球的视野比我们在他那个年纪的时候要强太多。

《深网》:您强调科研人员的passion非常重要,热爱能够被培养吗?

张宏江:好奇心或者对于一件事情的热爱确实很难培养,某一个领域让你真的感兴趣才能培养出来。

应试制度对好奇心本身不是件好事。我们每个人的IQ都有限,如果应试要求占掉你太多精力,可能就没有那么大的带宽来关心这些探索性的东西。

我们看今天大学的课程,对比《费曼物理学讲义》这样的书,显得太过枯燥。中国大学的教育似乎培养的都是工程师,却忽略了很多围绕“育人”本质的工作。

譬如,很少去讲一个物理定理的来龙去脉,科学家是个什么样的人?新发现是在怎样的情况下产生的?当时的问题是什么?例如,人们是怎样从认为太阳围着地球转到发现真相是反过来的,又是怎么发现地球不是平的而是圆的?像这些有趣的小故事都讲的太少太少,但它们对培养人的兴趣至关重要。

本文作者:程潇熠,来源:深网,原文标题:《对话张宏江:AI大爆炸至少将持续十年》

风险提示及免责条款
市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。
相关文章