作者:周源/华尔街见闻
尽管多家智能终端商宣称在端侧成功部署数据量级惊人的AI大模型,但C端用户并无明显感知。
“端侧AI大模型到底有什么用?画几张AI图?这有啥实用性?有和没有,没啥区别么!?”
1月10日,荣耀推出平台级AI全面使能的操作系统MagicOS 8.0:包含的“任意门”功能,以平台级AI及端侧大模型为基础,真正落地了具有高度实用价值(C端用户、B端开发者和商业机构)的端侧AI能力。
这将改变C端对端侧AI大模型体验无感的现状。
荣耀任意门的创新价值,源自这是全球首个在端侧实现的基于意图识别的系统级功能。
所谓系统级功能,即不是独立的类APP应用,而是被包含在用平台级AI赋能的MagicOS 8.0操作系统中。用新的交互方式,快速调取MagicOS 8.0构建的生态原子服务能力。这既能大幅提升C端用户体验,也能进一步促进B端的服务效率。
同时,由于在端侧实现多AI模型的部署和调取,故而能保证C端用户隐私数据的安全性,也能随着用户调取服务频次的增加,端侧越来越“懂”用户。这就是荣耀说的——“越用越好用,越用越懂你”。
看上去荣耀正在持续投入完善“以人为中心”操作系统的生态圈,平台级AI能力不断进化,进而在C端和B端之间建立高效的沟通桥梁。
交互方式大迭代再次出现
1月10日荣耀发布的MagicOS 8.0,与iOS、鸿蒙操作系统最大的差异,在于MagicOS 8.0通过系统级功能——任意门,实现了行业首个基于C端用户意图的智能终端交互新范式——意图识别人机交互(IUI:Intent-based UI),它突破了传统基于用户需求查找服务的方式,进化为基于AI意图识别的主动服务方式。
这是MagicOS 8.0最显著、也是最重要的创新。
纵观终端技术发展史,推动人类工作效率、新型应用和全新产业发展的关键力量,包含极为重要的模块:交互方式的迭代。
1955年诞生的批处理系统(BP:Batch Processing)是操作系统的雏形,也是人机交互在完全人工操作基础上的首次迭代。这套操作系统最早运行在第二代通用计算机上,如IBM的1401和7094 等,运行时为单线程方式。
到了1960年代,集成电路技术高速发展,催生了“多道程序系统”(多线程)和“分时系统”,后来又进一步演进为“实时操作系统”。
交互方式变革难度极大,故而从1955年到1964年,先后从完全人工操作,再到单线程,继以多线程,之后又历经多年迭代,1979年诞生命令式交互方式:微软公司为IBM个人电脑开发出的单用户单任务的实时操作系统——MS-DOS。
从最初步的原始交互形式到DOS系统,耗费整整24年(1955-1979)。1983年,初代图形用户界面诞生,也就是MacOS或Windows系统;又24年后的2007年(1983-2007),苹果创始人史蒂夫·乔布斯以触控式交互的初代iPhone,完成交互方式的重大迭代,乔布斯也同时开创了移动互联网产业。
在2007年之前的这些传统人机交互要实现用户(人)通过机器调取服务,总的来说,需要四个步骤:明确意图、查找服务、回忆操作和逐步完成。
这种交互是基于记忆和查找的方式,学习成本高,交互效率低,还需要人去理解设备,但在端侧大模型技术出现前,无法简化过程或改变这一现状。当端侧大模型出现后,设备理解人,就成为了现实可能。
2024年,距乔布斯开创的触摸式交互,又过去了整整17年。
在端侧大模型的加持下,计算终端历史上的第四种用户界面范式迎面而来:这是一种全新的交互机制,从体验端来看,计算终端能主动理解用户意图,完成最终任务——这就是意图识别人机交互(IUI)。
荣耀魔法OS 8.0的IUI支持自然语言、语音、图片、手势、眼动等多模态输入输出方式,可智能识别用户意图,实现高效推理决策,主动提供懂C端的个人化服务,高效完成复杂场景任务闭环,大大降低了使用门槛,同时也提升了交互效率。
荣耀改变交互方式的能力,通过MagicOS 8.0内置的荣耀全场景智慧引擎Magic Live实现平台级AI的场景感知、意图决策和用户理解。当C端用户想要调取各种APP应用时,通过“任意门”,能实现一键直达。
Magic Live是荣耀在2016年推出的初代Magic搭载的智慧引擎。2024年,Magic Live何以实现平台级AI的全场景用户意图感知能力?
新增人因内核支撑新交互
在解释Magic Live何以具备平台级AI用户意图感知能力之前,有必要对Magic Live、MagicOS 8.0和任意门的关系,做个概括:依靠平台级AI“Magic Live智慧引擎”,MagicOS 8.0得以实现“任意门”能力,可以基于意图识别让服务实现跨应用、跨设备一步直达,以及用户个体需求在多种应用之间的智慧流转。
可见,在“任意门”能力的背后,实际上是Magic Live在起关键支撑作用。荣耀将Magic Live作为MagicOS 8.0的内核。
荣耀CMO郭锐对华尔街见闻说,“操作系统首要问题就是确认采用什么内核,比如是宏内核还是微内核?”
事实上,荣耀用AI重构系统,在2016年便已具备雏形,荣耀推出的第一代Magic系列智能手机,便搭载了Magic Live智慧引擎。
那时Magic Live更多地体现在提升荣耀智能手机的体验,较为碎片,没有形成系统,如打游戏开枪的触控反应,比竞对的产品更快;手机在感受到用户目光注视时就能自动亮屏;用户在机场时,能自动推送登机牌;在用户上班路上,自动推荐音乐等等。
2022年发布的MagicOS 7.0,依靠Magic Live的平台级AI能力,构建了YOYO智慧生命体,带来YOYO建议的主动服务,在智慧出行、智慧生活、智慧娱乐三大场景中推送多种卡片提醒,比如航班、高铁、观影、打卡、快递、地铁码、充电和还款提醒等等,带来随时随地、恰到好处的关心,从而建立了IUI的雏形。
之后就是2024年1月10日推出的MagicOS 8.0,内置的具有全新交互形式的“任意门”功能。
在明了Magic Live的迭代过程后,现在可以做出进一步解释。
“这次我们对Magic Live平台级AI做了人因内核的升级。”郭锐对华尔街见闻说,“荣耀MagicOS 8.0现在具备双内核:一是基于硬件(NPU、GPU或CPU)驱动的设备内核;第二个是人因内核,即个人知识库和端侧AI。”
所谓“人因”,就是与人相关的因子。
首先是个人知识库:人的个体与行为类因子,像年龄、性别、健康状态、运动习惯、生活方式和工作休闲时间等;其次,人的位置和状态感知,也就是人所处场景的相关因子,系统可感知人的位置和人的状态(走、跑、骑、乘等);第三,人的习惯都做到数据化。
华尔街见闻注意到,荣耀多次强调平台级AI,这种类型的AI有哪些特点?也就是,什么是平台级?有什么作用?
平台级AI,就是荣耀并不研发APP应用,只通过操作系统本身内置的AI能力(通过软件实现),帮助C端(用户)与其他的B端(企业)或C端沟通,或达成交易。
荣耀研发管理部总裁邓斌对华尔街见闻说,“与应用级AI不同,平台级AI能作为技术底座全面使能操作系统,我们将之定义为下一代操作系统的新内核。”
实际上,传统OS内核负责管理和调度系统的硬件资源,如CPU、内存、硬盘和I/O设备,作用是确保整个系统的正常运行和计算资源的高效利用。
随着用户需求的不断增加,系统需要解析多种与人相关的因子,以此构筑真正以人为中心的全新体验。此时,就需要平台级AI的能力作为支撑,割裂的、碎片式的应用级AI无法满足这种数据量级的技术要求。
荣耀CEO赵明曾对华尔街见闻多次表示,围绕“以人为中心”,去创造价值,既是荣耀技术的出发点,也是荣耀需要不断接近的技术终点。
数据隐私安全和百模生态
荣耀构建的平台级AI能力“Magic Live”,增加了人因要素从而新增了系统内核——人因内核,其数据基础是个人知识库。以此为基点,荣耀最新发布的年度旗舰Magic6系列,能通过“任意门”实现基于用户意图识别的服务调取。
赵明说,“任意门能映射到第一代荣耀 Magic解决方案。荣耀从Magic一代开始,真正把荣耀的发展逻辑和线条梳理出来,后面有多少和AI、意图决策相关的都是沿着当年的路线在逐步发展。”
这番解释实际上是在回应近日罗永浩对荣耀“任意门”抄袭锤子手机One Step的质疑。赵明在媒体见面会上公开表示可以把荣耀Magic6手机送给罗永浩,让“罗老师”有个实际体验。
郭锐告诉华尔街见闻,任意门的重点在于“任意”,而能否实现“任意”,除了强大的AI能力,也需要丰富的生态做支撑。目前,荣耀已正式推出“百模生态计划”,探索基于意图交互的智慧服务新生态。
在系统识别用户意图,并通过“任意门”提供相应的服务解决方案的过程中,涉及到终端对用户所处场景的意图理解程度。这种理解深度,建立在荣耀此次发布的平台级端侧AI大模型——魔法大模型的基础上。
这个大模型由荣耀自研,数量级为70亿参数。通过与高通的深度调校,荣耀靠着自研量化压缩技术,将大模型压缩后再部署于高通骁龙8 Gen3上,以此实现端侧运行的流畅度和用户通过任意门实现需求与服务两者匹配度的丝滑性。
因此,与高通的联合深度调校成为关键环节。邓斌告诉华尔街见闻,影响端侧大模型支撑平台级系统性能的核心要素,并非算力强弱,而是内存带宽。
“若带宽不足,对端侧推理效率有重大影响。比如用户提问,系统会耗费相当长的时间才能给出答案。”邓斌说,“这就需要联合高通,做性能调优和调度机制优化。”作为优异体验的关键,如功耗、散热和由此影响的续航,荣耀和高通也在技术底层做了深度优化。
在荣耀Magic6系列端侧部署的AI大模型,其训练和推理数据来自支撑人因内核的C端用户个体要素。对这部分C端个体的人因内核涉及的数据,邓斌说,荣耀对此做了脱敏处理,以此保证用户的隐私安全。
对于个人用户来说,数据安全和隐私问题是重中之重。作为个人化的专属端侧AI大模型,荣耀魔法大模型必须消除C端用户对数据安全和隐私保护的担忧。此时,部署在端侧,基于本地的个人知识库与以本地为主的数据推理就成了极致安全的保障。
“荣耀在一开始做平台级AI时,就践行由用户自己掌握数据的原则。为此,我们坚决不让应用读任何个人信息,这才能让用户真正处于安全地带。”邓斌说,“举个例子,某用户通过任意门调取了某个APP的服务,我们看不到用户调用了APP哪种具体服务,比如付了多少钱,浏览了哪些商品,在哪些页面停留了多长时间等等。
荣耀构建平台级的端侧AI能力,追求能让C端用户感知到全新的体验。华尔街见闻注意到,行业其他厂商推出的智能终端,也有类似“任意门”功能,但那是碎片化的、无体系的、时常会对C端用户形成干扰的功能,还缺乏C端用户意图识别能力。
荣耀系统级的“任意门”功能,背后策略用赵明的话说,就是“我们会持续迭代‘以人为中心’的操作系统,不断提升平台级AI的能力”。
若对荣耀构建的AI根技术的未来做个展望,荣耀魔法OS很可能会凝聚全球AI力量,而荣耀也会向着世界荣耀的目标不断迈进。