蚂蚁站在新十年的起点

技术颠覆。

走过以支付开头的10年支付宝时期,经历了金融为主的蚂蚁金服的10年,如今的蚂蚁,意图用科技创新,定义自己的新十年。

5月28日,蚂蚁集团第九届527蚂蚁技术日首次对外开放。在当天的AI集市中,蚂蚁集团AI全矩阵AI集体亮相。

其中,最核心的产品当属蚂蚁集团旗下的“支付宝智能助理”、“支小宝”和“安诊儿”三大管家。像金融管家“支小宝” 目前用户已达4300万人,能为用户提供行情分析、持仓诊断、保险配置、投教科普等理财保险服务。

对蚂蚁来说,5月27日是个很特殊的日子。2015年5月27日,因光纤被挖断,部分支付宝用户两个小时无法登录账户。这次事件成为蚂蚁历史上一次重大技术事故。因为这件事,这一天被定为蚂蚁技术日。

借着蚂蚁技术科技日首次对外开放,蚂蚁也系统地向外诠释了它对未来科技十年的思考。

“我们相信AI不为替代人而生,而是为每一个人而生。”蚂蚁集团CTO何征宇认为,尽管AI给行业带来了很多变化,但目前来看,AI仍然是一项基础技术。而人之所以为人,是因为人的思维模式,不仅仅是对话本身。

“现在的问题是,很多的产品从ToC的角度来讲,似乎很难被普通的消费者,或者说让每一个人都获益。但我们的愿景和使命是希望AI和扫码支付一样,能够便利每一个人的生活。”何征宇表示,蚂蚁集团的AI战略是要让AI便利每一个人的生活。深耕严谨产业,聚焦原生多模态以及规模化服务能力将是蚂蚁集团基础大模型有别于其他行业大模型的特点所在。

何征宇还表示,AI的规模落地扔需要面临可靠性、经济性、易用性这三大挑战。他解释说,可靠性是任何一项技术真正能够落地所必须解决的问题。比方说,今天的AI 90%的时间是可靠的,但仍有10%的时间是不可靠的。如果生成式大模型不能克服这一点,那它就永远只是个工具。

除此以外,经济性仍是一个很大的问题。“今天我们依然处在钻木取火的阶段,所以它的成本特别高,”何征宇说,“你得准备两根棍子,还得消耗大量的体力,才能把AI这个东西给取出来。”这也导致AI时代快速地进入到了补贴互联网阶段,许多云厂商选择免费开放API。尽管这一行为逆市场,但也意味着大量的资源在进入AI领域。不过,他也指出,站在中国科技的角度,迫切需要Transformer加英伟达之外的第二条路。

在易用性方面,何征宇则认为,任何一个技术要真正的生根发芽、真正的面向全体大众,它的门槛必须足够低。只有当一个相机变成傻瓜相机之后,才会进入到普通人的生活里。“如果说你今天还在想着ChatGPT怎么用个更好的Prompt,能够让它的反应更好一点的时候,意味着它的门槛一定太高了。”

不过,何征宇拒绝用Super APP来描述AI的未来。在他看来,对于已经拥有Super APP支付宝的蚂蚁集团来说,目标不是创造出下一个支付宝。“下一个支付宝还是支付宝,”何征宇说,“我们希望把AI这种最先进、最深刻的技术,藏在我们的服务后面。”就像曾经的蚂蚁将所有技术隐藏在一个小小的二维码背后一样。

以下为与何征宇交流实录(经编辑):

问:很多工程师日常开发当中,已有不少代码由AI生成。这会不会改变市场对程序员的需求?

何征宇:今天我们所谓的AI编程它只是一个Co-pilot(副驾驶),只是针对不同的人有不同的Co-pilot(副驾驶)。例如,高级别的程序员,他的需要更多是,一些很简单的代码他不想写了,有些东西他调一个库就完了。而对于一般的程序员,他需要你告诉他一些经典的写法,提醒他常规的错误和编程规范。对产品经理这些不想写代码的人来说,他就需要一个端到端的东西。所以,我认为不同的人的需求应该是不一样的。我们不能简单地讲,今天有了CodeFuse就不需要程序员了,这是人为创造的一种焦虑。

问:AI技术会给世界带来怎样的变革?

何征宇:我们希望给世界带来微小而美好的变化。马斯克带大家登上火星,去火星我觉得很伟大。但能让地球上所有人过上美好的生活,我认为这同样伟大。

十年前我们开始进入金融行业时就在说,要让每个人都能够享受到银行行长的待遇。之前你要去银行取个钱、办个事你得请个假。但是今天因为数字化,因为我们的技术,有了7×24小时的银行。我觉得这就是我们带来的变化。

二维码这个技术也不是支付宝发明的,但是扫码支付确实在中国是我们第一个推出来的。二维码这个技术是日本人发明的,但它就是一个技术而已。而为技术找到一个合适的场景,然后把它变成一个普惠的服务,这是支付宝最擅长的。所以,我们今天看AI也是这个逻辑,不是说要做一个普惠的技术的提供者,而是如何用好最好的技术,做一个最普惠的服务的提供商,这是我们的关键。

问:现在大家都在做原生多模态,您怎么理解原生多模态?

何征宇:我们认为这波AI革命带来的并不是AI本身,而是新的人机交互方式。人的交互,不仅有语言、表情还有手势,这就是我们理解的多模态。多模态并不是说单纯去识别一个花一个草是什么。原生多模态核心的逻辑其实跟大模型一样,是将人类的语言和人类的手势、和所有自然界的东西对齐。原生多模态意味着什么?意味着我们要把世界万物、各种模态的数据,要把一个手势代表的意思和语言文字表达出来的意思要对齐。这是大模型最核心、最关键的东西,也是我们正在做的事情。

问:如今,很多公司都在尝试将AI和硬件相结合,希望能带来新的交互方式,您怎么看待AI+硬件这件事?

何征宇:我们在做一些探索,有一些想法,但并不特别成熟。我个人认为,软硬件结合目前还不会是一个很成功的产品,但不代表它未来不会是。

因为iPhone也是到iPhone4或者iPhone4S,才真正爆发。对整个科技行业来说,想要达成目标,就必须先修桥,先修路。也就是说,得先有一个基建的过程,今天的AI大模型也是这样。试想一下,中国如果当年没有3G、4G,今天也不会有移动互联网。硬件的逻辑也是一样的,硬件是基建,它能够把更好的体验、更好的服务带给每一个人,但这并不意味着它马上就能产生一个巨大的消费市场,这种例子我认为还是比较鲜有的。

就算是苹果这么厉害的硬件公司,它最终能够产生真正的用户黏性或者说能够提供最终的用户价值的,其实是上面的软件,以及它整个生态所提供的服务。所以,我们认为,硬件只是一个基础,最终能够通过这个硬件,通过上面叠加的软件、算法提供什么样的服务,才是关键。

问:大模型目前仍面临可靠性的问题,从技术层面来看,有没有办法可以进行优化?

何征宇:肯定是有手段和办法的。第一个是大家都知道的所谓的RAG。它的核心在于控制它的输入。数据只能从这个知识库里流向到模型系统,然后再做输出,本质上是控制它的输入。另一方面,我们要尽量收紧它可输出的范围,来进一步的控制它的精确性。

但问题在于,AI其实主要有两个方向,一个是泛化,一个是精准。足够泛化就很难精准,足够精准就很难泛化,这是一个本质矛盾。而我们要做的,就是在控制输入的时候它要有足够的泛化能力。也就是说,中间的模型要足够大,内容要足够多。如此一来,当我们对输入和输出进行控制之后,才能够保证训练好的大模型既有足够的精准性又有足够的智慧。

风险提示及免责条款
市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。