当地时间10月21日,在微软AI之旅伦敦站活动上,微软CEO萨提亚·纳德拉发表主题演讲,介绍Copilot、Copilot&AI全栈、Copilot设备三大平台的创新。
纳德拉认为,与摩尔定律类似,在AI领域Scaling law(缩放定律)也是存在的。定律表明,每六个月,计算性能都会翻倍,其中一部分是由于计算能力的提升,但更多的是由于对数据和算法使用技术的改进。AI时代下,新的衡量单位是“每美元每瓦特的token数”,这是新的货币,新的衡量标准。
纳德拉称,Copilot现在是所有AI的用户界面,其交互的简便性就像当年创建Excel表格一样简单。
就像创建一个财务预测的Excel表格,现在人们可以使用低代码/无代码工具在Copilot Studio中创建AI代理,并将其集成到Copilot中。用户可以把这些看作是新型的应用程序,任何人都可以创建这些应用程序,不需要等待别人来为你创建一个应用程序。
纳德拉强调,现有大规模的证据表明,这些工具正在从根本上改变工作模式,提升价值、减少浪费。过去工业公司通过精益管理实现的效果,现在终于在认知工作中以规模化的方式实现了。
纳德拉同时透露,OpenAI的o1模型正在优化 AI 开发,并已进入递归阶段:“我们正在使用 AI 来构建 AI 工具,以构建更好的 AI”。
会上,微软还宣布,使用Copilot Studio创建自主代理的功能将于下个月公开预览,让更多客户能够利用AI重新构想关键业务流程。
以下为纳德拉讲话原文,由AI翻译:
早上好。回到伦敦,回到英国,感觉太棒了,尤其是在这样一个新技术平台诞生的时刻,能够谈论它,看到它在英国的影响,并探讨这种平台转变所带来的活力,令人兴奋不已。
事实上,我今天早上还在回忆,微软在英国已经有40年了。我自己在过去30年里也经常来英国,我想我第一次来,第一次主题演讲的时候。
我在90年代初做了一个分会场的演讲,我记得我做的是Excel和VB的演示。你知道,这很有趣。我来这里的时候,个人电脑客户端服务器刚刚诞生,然后经历了互联网的网络时代,接着是云计算和移动时代。现在我们正处于至少是向AI这种新技术转变的初期。
我觉得这总是有帮助的。我发现让自己了解核心驱动力是什么是非常有帮助的。
我记得在92年加入微软的时候,我对技术发展轨迹有一种隐含的理解,至少是基于摩尔定律,基本上我所需要知道的就是这个。事实上,我记得在91年参加PDC(专业开发者大会)时说,哇,接下来会发生什么很清楚,那就是x86和个人电脑架构不仅会赢得个人电脑市场,而且基本上会赢得服务器市场。
到90年代末,情况确实如此。
现在,在某种程度上,类似的事情正在发生,我们可以追踪的新的“定律”是"Scaling law缩放定律”。
正如人们在AI领域所描述的那样,它是一个经验定律,就像摩尔定律不是物理定律一样,缩放定律也是经验观察所得,但它被我们称作定律,并且一直有效。同样地,缩放定律表明,大约每六个月,我们的计算能力都会翻倍。
事实上,我经常思考的一件事是性能。你甚至可以说,现在的货币单位是“每美元每瓦特的token数”,这是新的货币,新的衡量标准。每六个月,性能都会翻倍,其中一部分是由于计算能力的提升,但更多的是由于我们对数据和算法使用技术的改进。
你可以说,这一转折点始于2010年代初期的深度神经网络(DNN)时代,但在2018年到2019年,随着大语言模型(LLM)和Transformer的出现,这一进展显著加速,并且还在继续。
这一变化体现在三个基本方面:
首先,计算接口的本质正在发生根本变化。一旦你有了自然语言处理,尤其是多模态的自然语言处理,包括图像、语音、文本和视频的输入与输出,这意味着每一个计算界面都会发生改变。
其次,推理能力在增强。如果你看看刚刚发布的o1,它显示了越来越强的推理能力,无论是规划还是推理能力。在过去70年的计算历史中,我们一直在数字化人、地点和事物并理解它们,现在我们有了一个新的推理引擎来理解它。
最后,你可以输入更多的上下文和记忆,把这三个方面结合起来,你就在建立一个非常丰富的AI或代理世界,在这个世界里你将拥有这些AI或代理。有些AI和代理是个人代理,有些将在团队环境中工作,在组织或业务流程中工作,甚至跨组织工作。
所以这个丰富的AI代理生态系统会增强我们已经建立的一切。整个数字基础设施和我们今天拥有的工具都会在这个代理世界中得到增强,我们使用缩放定律作为基础力量来构建这些AI代理。
当然,这很棒。所有这些技术都会存在。问题是,我们该怎么做?最重要的是,我们如何将其转化为我们作为公司、作为个人和组织所拥有的最重要使命,那就是能够赋予人们能力,让他们能够用以前任何其他技术都无法做到的事情。
所以对我来说,这是最终的考验,那就是我们能否利用,在这个国家,工业时代和工业革命的一些最重要的技术都是在这里创造的。问题是,我们现在能否回到那个时候,通过无论是科学发现还是生产力,真正对人类生活和状况产生那种深远的影响,我们能否看到因为技术而带来的创新繁荣?
所以这就是我们的目标。这就是我们在这里赋予每一个人和每一个组织权力的使命,无论是小企业提高生产力,大型跨国公司在全球更具竞争力,公共部门提高效率,健康结果改善,教育成果提升。所以这就是这一切的真正意义所在。
现在对我们来说,为了实现这个目标,我们正在构建三个平台。第一个是Copilot。
对我们来说,你应该把Copilot看作是AI的用户界面。这是我认为最简单的理解方式。然后我们有Copilot和AI堆栈。这样你就能够构建自己的AIS和AI智能体以及Copilots。我们有一个完整的堆栈。最后是这组新的设备,也就是这些Copilot设备。所以我想谈谈每个平台,从Copilot开始。
现在,正如我所说,如果你从这个理念出发,即这个智能体世界最终需要与我们相遇,我们也需要与它相遇。这意味着你需要一个用户界面,对吧?就像个人电脑或手机是用户界面,或者手机或个人电脑上的应用程序是与数字技术的接口一样。这些Copilots或者说Copilot是所有这些AI的用户界面,对吧?
即使在一个有很多智能体自主工作的世界里,它们也需要提出异常情况,从我们这里获得许可。问题是,这是如何发生的?
它通过这个新的组织层来实现,特别是关于工作是如何完成的。事实上,工作产物和工作流程将会改变。一个很好的例子是,就在几个月前,我们推出了一个叫做Pages的东西。就像在90年代,我们推出了Excel或者Word,它们是创建新产物的编辑器。
Pages是第一个,我想说它是创建AI优先产物的用户体验。我可以搜索网络或我的工作来检索信息,然后我可以把它放入Pages。它是一个我可以在组织内分享的文档,我可以和AI以及人类一起工作。
事实上,我使用的比喻是,我用AI思考,与我的同事一起工作,这就是新的工作流程。而之前的工作流程是我独自思考,创建文档,然后在组织内部进行共享与协作。
但现在,当我工作时,不仅有AI作为认知放大器帮助我,还可以与AI共同创建文档,并与同事合作完成任务。这就是Copilot时代的开端,它不仅仅是一个聊天界面,它展示了如何通过聊天这一模式来检索信息,同时也引导我们走向更复杂的工作流程和协作方式。
现在你可以扩展。所以另一件事是,这不仅仅是关于我们创建的任何特定的产物编辑器或工作流程,你可以用你构建的任何智能体来扩展Copilot。
事实上,Copilot Studio是一种低代码、无代码的方式,让你能够构建智能体。这些智能体实际上是基于一组丰富的数据源。
例如,谁在为谁工作,谁是我在某个项目中的同事,与某个团队或项目相关的文档有哪些,这些文档、人员和项目之间的关系是什么,所有的电子邮件和Teams对话都属于这一数据库。这个数据库被称为Microsoft Graph或M365图谱。你可以将这些数据与业务流程数据结合起来,例如用Fabric收集的数据。这些数据源可以为代理提供支持。
事实上,一个很好的简单例子是,假设你想构建一个现场服务智能体,你想让它与Copilot对接。你所要做的就是给它一个系统提示。告诉它,嘿,我想让你成为一个现场服务智能体,指向一个Sharepoint站点,那里有一堆与现场服务相关的文档。再给它添加其他数据源,在这种情况下,他们的Dynamics是现场服务的记录系统,然后你就会得到一个输出,本质上就是一个现场服务智能体,现在你可以和它交谈,就像和任何其他普通的Copilot对话一样。
所以这种简单性有点像过去我们创建一个Excel电子表格。它没有比那更神秘的了。就像你可以创建一个Excel电子表格来做预测一样,你现在可以使用像Copilot Studio这样的低代码、无代码工具来创建AI智能体,并把它放入Copilot中。你甚至可以把这些看作是我们任何人都可以创建的新应用形式,对吧?所以你甚至不需要等待别人为你创建这个应用你才能使用它。所以这就是我们正在构建的Copilot和Copilot + 智能体生态系统。
其影响是巨大的。实际上,如果你看一下微软内部,例如销售和营销职能部门,我们已经有了定量的结果,表现为工作效率提高了两位数。这是对营收增长的影响。
再比如,客户服务、IT帮助台、HR帮助台,这些部门的员工参与度、员工满意度、客户服务代理满意度都在提升,而浪费和成本在下降。法律部门、财务部门也是如此。
因此,我们现在有了大规模的证据表明,这些工具正在从根本上改变工作模式,提升价值、减少浪费。过去工业公司通过精益管理实现的效果,现在终于在认知工作中以规模化的方式实现了。
而且它也正在英国这里发生。
事实上,我有机会看到已经在使用这个的客户。我看到了各种各样的客户,看到本地的Copilot例子真是太棒了。所以我有机会见到了高伟绅律师事务所(Clifford Chance),这是一家律师事务所,他们正在做一些很了不起的事情。是的,他们解释了围绕并购交易发生的工作流程。事实证明,使用Copilot和Copilot Studio,你可以创建这些智能体来简化整个流程。
我也有机会见到了联合利华(Unilever)。你知道,我之前没有意识到,但是对于像联合利华这样的组织,它有大量的营收用于营销,因为毕竟他们的多种产品要面向全球30多亿用户。
他们做的最大的事情之一是这些创意简报。而创意简报的准确性对他们来说非常关键,这样他们才能有营销影响力。但关键是创建创意简报所涉及的繁琐工作,或者它的效率,或者它的准确性。他们在这方面下了功夫,创建了一个很棒的工具,这个工具改变了创意简报的准备工作和质量。
所以这些只是我们的两个客户的例子,他们已经在部署这些AI智能体和Copilots,以在他们的组织内部推动真正高影响力的生产力。
今天令我们感到兴奋的是,我们与英国政府部门达成了合作,希望不仅在私营部门,也能在公共部门推动技术的普及。因为归根结底,我认为我们能产生最大影响的领域可能是公共服务,无论是医疗、教育,还是能源,或其他任何政府部门,都会因为这项技术发生转变。而这一切的起点就是让公务员掌握并使用这项技术。毕竟,当我提到减少繁重工作、提高生产力时,最终受益的将是英国人民,因此,这是我们可以产生巨大影响的领域。所以我们对此次宣布的合作感到非常激动。
谈到英国的AI技能提升,这里引用了一些来自LinkedIn的数据。昨晚我看到这些数据,觉得非常了不起。数据显示,AI技能的获得率自2019年以来增长了88%,这印证了英国经济中所具备的结构性优势,如开场发言中提到的人才储备和基础设施正在逐步完善。我相信这将推动英国在AI时代的进一步发展。这是一个非常令人振奋的景象。
当然,我们并没有就此止步,真正让我们感到兴奋的是接下来的进展。今天,我非常高兴地宣布,我们正在AI平台上迈出下一步,推出Copilot Studio自主代理创建工具。
你们将看到我们发布的新工具,帮助大家创建这些自主代理,更重要的是,我们将推出一些已经内置到Dynamics 365中的代理产品,它们能够在需要用户界面时与Copilot对接,但也可以独立运行。
为了展示这些内容,我想请我的同事贾里德·斯帕达罗(Jared Spadaro)上台。
(Jared开始现场展示麦肯锡的创新,播放Clifford Chance、联合利华、Pets at Home等客户使用视频)
希望这可以让大家对Copilot的发展有所感受,Copilot正逐步成为工作流程和工作成果的组织层。Copilot Studio加上代理则是协调层,它与Copilot协同工作,帮助这些代理在个人工作、组织工作或业务流程中共同运作。
接下来,我想介绍下一个平台,也就是Copilot加上代理的堆栈,或者说AI平台。
最终,我们希望每一层技术栈都能为开发者所用,包括我们构建的Copilot、Copilot Studio和代理,所有这些都可以为每一个软件开发者提供支持,让他们能够构建自己的AI系统。
这首先要拥有最广泛的原始基础设施。
所以当我们想到Azure时,我们把Azure看作是世界的计算机。我们正在英国的 60 多个地区构建它。事实上,去年我们并投入了 25 亿多美元用于扩展。而且这将持续进行。
我们将为英国带来最好的基础设施,包括传统计算和 AI 计算,这样你就有了可用的基础基础设施。我们正在做很多工作以确保这个基础设施针对 AI 工作负载进行了优化。
从芯片级别开始,例如我们与NVIDIA的合作。我刚刚看到GB200的上线,它采用了全新的液冷技术。事实上,我们借用了液冷技术,因为我们也在为自己的 Maia芯片进行液冷,现在这项技术已应用于不同的芯片上。我们还与AMD有着很好的合作关系,因此在芯片层面上有着很强的合作。
接着,我们将进行优化,无论是训练还是推理,都为你构建Copilot提供了最好的基础设施。大量核心基础设施方面的工作正在进行。
现在,对于任何构建人工智能应用的开发者来说,另一个非常重要的考虑因素是数据。因为最终,无论是训练还是推理,以及进行检索、增强生成等操作,你都需要真正整理好你的数据资产。
为了做到这一点,意味着你要能够将所有数据上传到云端并与人工智能对接。所以实际上,哪里有人工智能计算,数据就会被吸引到哪里。
因此,我们正在做的一件事是,无论你使用的是甲骨文(Oracle)的数据资产,还是Snowflake的数据资产,或者其他任何数据,你都应该能够将其上传到云端。
在此基础上,我们自己正在构建一种一流的、我称之为云原生的基础设施 —— 数据基础设施,用于从联机事务处理(OLTP)的所有方面,无论是 Cosmos GB,还是 SQL,或者是 Postgres,又或是为人工智能时代构建的一流分析数据库 Fabric。
所以数据状态处于一个可能正在发生一些最佳工作的地方。实际上,考虑到人工智能和数据,要知道不存在无状态的人工智能应用。人工智能应用程序接口(API)是无状态的,但一旦它们在实际工作负载中与实际应用相结合,就会变得非常简单明了。例如,顺便说一下,ChatGPT 是 Cosmos DB 等的最大客户或用户之一,或者像 Azure 搜索也是一个例子。这只是向你表明,一旦你构建像 Copilot 或 ChatGPT 这样的应用,你需要强大的数据资产。
我们还在构建应用服务器,因此,基础设施和数据准备好后,下一步就是应用服务器。我还记得以前来这里的时候,谈到.NET,而今天斯科特(微软 CTO)也会来讨论AI,他就是.NET项目背后的关键人物之一。
现在,我们又回到了另一个应用服务器时代。这一次,我们为云原生应用程序构建了应用服务器,无论是容器、应用服务,还是AKS和函数计算,这些都依然是必需的。事实上,当我回顾ChatGPT的架构时,它的基础计算资源提供方案是GPU配比常规计算AKS的方式。
然后我们进入AI应用服务器时代,AI应用服务器首先提供了最广泛的模型选择。我们非常兴奋地与OpenAI合作,不断推出最新的前沿模型,无论是GPT 4.0还是o1。此外,开源社区中,包括LLaMA、Mistral等,甚至一些闭源的供应商,如Anthropic,我们都支持它们的模型。因此,开发者可以选择最广泛的模型。
在拥有广泛模型选择的基础上,我们还提供了“微调即服务”功能,你可以对这些模型进行监督微调,从而将其集成到你的应用程序中。我们还提供了一些工具,比如检索增强生成(RAG),通过Azure搜索帮助你将应用程序与数据对接,并将其与大型语言模型(LLM)的使用结合起来。
此外,我们还提供了确保应用程序安全性的服务。例如,我们为开发者构建了一些安全措施,帮助他们在使用这些AI工具时设置防护栏。因此,我们对应用服务器和AI应用服务器上正在进行的创新感到非常兴奋。
当你有了应用服务器、AI应用服务器后,就需要最好的开发工具链。这也是微软自1975年创立以来最为骄傲的一点:我们最关心的始终是为软件开发者构建工具。Visual Studio Code、GitHub和GitHub Copilot是开发者生产力的新前沿工具之一。
实际上,我最近看到的一件非常酷的事情是,o1进入GitHub Copilot后,你可以使用AI进行下一层次的优化。屏幕上的内容展示了GitHub Copilot的自动编码器正在被o1优化。想象一下这种递归性:我们在用AI构建AI工具,以打造更好的AI工具。这种前沿生产力的创新非常令人激动。
未来两周内将举办GitHub Universe大会,我非常期待它的到来,因为届时我们将在GitHub Copilot Workspace中展示更多令人惊叹的新功能。实际上,英国现在有370万GitHub开发者,增长非常迅速,目前已是全球第五大开发者社区,增速达到22%,这非常令人欣慰。
今天早上我还见到了许多合作伙伴,首先是英国心脏基金会。他们多年来一直使用机器学习和AI,取得了非常好的成果。甚至像使用Azure语音服务来模拟紧急呼救电话这样的事情,也让我意识到,让人们习惯打紧急电话有多么重要。这是一个很好的例子,说明如何在关键时刻帮助人们。
汇丰银行展示了多个客户旅程中的一个案例,展示了客户关系经理如何进行信贷审批的整个过程,这一过程通过一些AI工具得到了彻底的改造。他们有效地构建了自己的AI代理,这些代理与他们的移动应用程序以及关系经理使用的应用程序进行交互。
我还与Mondra的开发人员见面,他们的工作令人难以置信。他们正在为整个食品安全和供应链构建一个数字孪生系统,这项工作涵盖了英国及其他地区的所有零售商,以此来提高可持续性。这款产品的影响力将会非常惊人,能够极大地改善食品供应链的可持续性。
另一个令我长期感到兴奋的初创公司是 WAYVE。他们采用了一种AI优先的方式来解决高级驾驶辅助系统(ADAS)问题,真正从零开始,重新思考如何利用AI来构建自动化解决方案。
很明显,我们可以看到,人工智能已经不再是“未来会来临”的技术,而是已经开始在一些非常复杂的应用场景中得到使用。
现在让我们来看一下这些AI平台在实际中的应用。接下来,我想介绍第三个平台——Copilot设备。我们在半年前刚刚推出了Copilot PC,这标志着一个全新时代的到来。在这个时代,CPU、GPU和NPU(神经处理单元)同时在边缘设备上可用。
到目前为止,缩放定律在云端表现得非常出色,而在未来,这个AI时代不仅仅局限于云端,还将涵盖边缘计算。
我们将看到一些根本性的突破,甚至在某些模型架构上允许在分布式计算架构中实现混合使用。因此,不能再以过去的客户端-服务器模式来思考问题,而是要将其视为一个连续的分布式架构。
这就是我们的设计方法。我们不会把Copilot PC看作是独立的设备,当然你可以将其用于隐私保护,但更重要的是,你可以将其与所有云端的工作结合使用。这就是这些设备将要带来的革命性变化。
我想在结尾谈谈可能支撑这三个平台的东西,我认为这非常关键,那就是可信的人工智能、可信的隐私和可信的安全。因为对技术的信任最终将是我所谈到的所有技术扩散的核心。因为如果你不信任它,你就不会使用它,这对任何人都没有好处。
所以我们所做的事情很简单。首先要有一套核心原则。无论是在安全方面,还是在隐私方面,或者在人工智能安全方面,都要有一套具体的原则。但不仅仅是我们做出的承诺,更重要的是我们正在构建哪些实际能力来推进我们所做出的承诺。
实际上,即使在今天,当你考虑,比如说,安全方面,当你部署一个新的人工智能模型时,在安全方面你首先要做的真正事情是测试对抗性攻击。这不仅仅是查找漏洞,更重要的是,比如像提示注入这样的情况,它对这个模型有什么影响?所以能够模拟对抗性攻击是一个重要的考虑因素,
或者是我们在隐私方面围绕机密计算所做的事情。这是在与最新和最先进的模型相结合时必须要做的另一件事。
至于AI安全性,我们知道大语言模型会产生幻觉,因此在AI安全性方面,我们正在使用AI来测量输出结果的可靠性。这些都是我们平台中内置的具体功能,它们帮助软件开发者建立信任,也让使用这些AI工具的用户能够信任这些产品。
所有这些都回到了我最初的观点:技术必须转化为现实世界的影响,影响一个人、一家组织,从英国开始,推动经济增长,真正改善经济体中的各项成果。
因此,我对所有这些创新将带来的未来充满期待,期待与你们以及合作伙伴一起推动这些创新的发展,期待未来几年回来时,能看到这些创新的成果。
非常感谢大家。