AI 创新的下一个前沿已悄然到来:智能体(AI Agents)和智能体推理(Agentic Reasoning)的崛起。这些技术正在以前所未有的效率和成本效益,彻底改变应用的构建方式,为各行业释放出巨大的潜能。
在 Snowflake Build 2024 的主题演讲中,吴恩达深入探讨了智能体的兴起及其背后推动的 AI 革命。
他指出,非结构化数据(如文本、图像、视频和音频)正变得比以往任何时候都更加关键,为企业带来了巨大的机会。
此外,吴恩达还分享了如何通过智能体和生成式 AI 的结合,以更快的速度构建和迭代新的 AI 应用,以下为这次演讲的主要内容:
你可能听过我说过,AI 是新的电力。这是因为 AI 像电力一样,是一种通用技术。如果有人问电力的用途是什么,这很难回答,因为电力几乎无所不能。
而如今的新 AI 技术正在为我们创造一个前所未有的机会,能够构建以前无法实现的新应用。
人们经常问我:“Andrew,AI 领域最大的机会在哪里?”我通常会以“AI 堆栈”来解释。在堆栈的最底层是半导体,然后是云计算和开发工具(包括 Snowflake 这样的工具)。
在这些之上是许多基础模型以及模型的训练过程。而事实是,很多媒体的关注点都集中在这些技术层面,例如生成式 AI 和新的技术进展上。
这些确实重要,但实际上还有另一层更重要的堆栈——应用层。因为我们需要通过应用层来产生更多的价值和收入,从而能够支持底层技术的持续发展。
因此,我花了大量时间思考 AI 应用领域,我认为这是构建新事物的最佳机会之一。
过去几年,尤其是在生成式 AI 的推动下,我们见证了机器学习模型开发的速度越来越快。
例如,构建一个情感分类器的传统方法可能需要一个月来收集标签数据,再花几个月训练 AI 模型,然后再用几个月部署在云服务上。
对于许多价值巨大的 AI 系统来说,这样的开发流程需要 6 到 12 个月。但有了生成式 AI,某些应用场景只需花几天写一个 prompt(提示词),再用几天时间完成部署。
这意味着,原本需要几个月甚至一年的开发时间,现在可能只需要 10 天左右。这种变化为快速试验和开发新原型以及快速发布新 AI 产品创造了巨大可能。
这一趋势的结果是,快速实验成为发明新用户体验的一种更有效途径。过去,如果需要花 6 个月开发一个东西,我们会非常谨慎地研究用户需求、制定产品计划,再投入大量精力来开发。
但现在,快速推进的团队可以说:“我们用一个周末开发 20 个原型,看看哪个有前景。如果 18 个失败了,我们就放弃它们,只保留成功的两个。”快速迭代和实验成为了一种新的发明路径。
然而,这种快速实验带来了新的瓶颈——评估(Evaluation)。在传统的监督学习中,如果你需要收集 1 万条数据点来训练模型,那么多收集 1 千条测试数据点也不算什么,因为成本仅增加了 10%。
但在基于大型语言模型的应用中,如果不需要标注数据,那么收集 1 千条测试样本的成本和时间可能显得非常昂贵。
因此,现在的开发流程更像是边开发边收集数据,而不是先收集数据再开发。我们会先构建一个原型,然后随着需求的增加逐步完善测试数据,以提高系统的稳健性和可靠性。
虽然模型原型的构建速度快了,但软件应用的开发依然包含很多步骤,比如产品设计、软件集成、部署后的运维等。
这些步骤并没有像机器学习建模那样大幅提速。这种不均衡的进展对组织产生了压力,迫使他们加快整个流程的速度。
在快速发展的环境中,我不认为“快速行动且破坏”是适合的口号,因为这种方法的确会破坏很多东西。我更喜欢“快速行动且负责任”这个理念。
我看到很多团队能够快速开发原型,并进行稳健的测试,而不将可能造成伤害的产品直接发布到用户手中。这种方法能够在快速推进的同时,做到负责任地开发和部署。
在技术趋势中,我最兴奋的一个是 智能体 AI(Agentic AI)。这种工作流程不仅可以生成文本,还可以结合研究、规划、修改等步骤,进行迭代式开发。
例如,用传统的大型语言模型生成一篇文章可能一次性完成,但智能体 AI 可以先生成提纲,进行研究,编写草稿,随后再修订和优化。
这种迭代式流程适用于复杂任务,比如法律文档处理、医疗诊断辅助或合规文书管理。
智能体 AI 的四大设计模式包括:
- 反思(Reflection):让 AI 审视自己的输出并改进。
- 工具调用(Tool Use):大语言模型可以发起 API 请求,执行具体任务。
- 规划(Planning):AI 为复杂任务设计执行计划。
- 多智能体协作(Multi-Agent Collaboration):多个 AI 角色分工协作,共同完成任务。
这些模式让我们能够构建比以往更加复杂和强大的系统。
另外,视觉 AI 正在崛起。过去很难从存储的图像和视频数据中获取价值,而如今,视觉 AI 的能力正在改变这一现状。
通过结合智能体工作流程,视觉 AI 能够高效处理和分析图像与视频数据,为企业带来新的价值。
例如,自动检测足球比赛中的进球片段、生成视频的元数据等,这些任务以前几乎是不可能实现的。
最后,我想强调四大 AI 趋势:
1)加速的生成式工作流:通过硬件和软件优化,让智能体 AI 运行更高效;
2)为工具优化的大模型:新的大模型不仅可以回答问题,还可以执行具体操作;
3)非结构化数据工程的重要性提升:文本、图像和视频数据的处理能力变得至关重要;
4)图像处理革命即将到来:图像处理技术的发展将为更多企业带来新的应用机会。
本文作者:有新,来源:有新Newin,原文标题:《吴恩达最新演讲——AI 四大趋势》