作者:周源/华尔街见闻
未来智能在智能化方面又迈出了一大步。
5月15日,未来智能发布会议办公垂直领域的生产力工具新品:新一代讯飞会议耳机“iFLYBUDS Pro 2、iFLYBUDS 2”和“viaim Kit 2”,为用户带来全新的软硬件方面的升级。
这是未来智能以“传统TWS音质和降噪耳机”产品和功能框架为基础,推出的基于“GAI”底层技术逻辑的垂直细分场景智能终端。在客观层面,起到了丰富中国AI产业生态的作用。
在这些GAI(生成式人工智能:Generative Artificial Intelligence)新品背后,未来智能的商业思考立足于这样一个基础——
科大讯飞联合创始人、未来智能董事长胡郁说,“我们的目标是通过软硬件(深度融合)一体化,以‘AI+硬件’产品形态的方式,实现用户在特定场景下的办公助手功能,并将这种体验做到极致”。
从这次发布的讯飞会议耳机新品的功能看,华尔街见闻注意到,未来智能和联想集团、OPPO、荣耀等不同类型的终端公司一样,其商业思考迭代成——以办公会议耳机为载体,为C端用户提供具有GAI能力的个人助手。
这与联想集团董事长兼CEO杨元庆称AI PC为个人用户提供“数字孪生体”的提法异曲同工。
这个商业目标,在技术和商业层面,如何实现?
收住:聚焦垂直细分场景
ChatGPT问世至今约有一年半共18个月。
在二级市场,对ChatGPT底层的GAI技术的热情,也从最初的迷茫到迅速转入高度热情,再陷入低谷,继而卷土重来,俄而再次进入相对平静状态,可谓大起大落。
与此不同的是,海内外产业界的态度和动作相对平缓。与二级市场相比,产业界更具有长期主义特征。
“从0到1,中国确实不如美国。但是,从1到100,中国的创新能力,傲视全球。”一家GAI技术公司的CTO与华尔街见闻交流时发出如此感叹。
从互联网技术再到移动互联网,原生技术和应用制造产业发展路径的历史,印证了此人的观点——PC、互联网、功能和智能手机、AI等原生技术,都源起美国,而作为技术应用大国,中国对原创技术的商业化应用探索,常常能做到“遥遥领先”。
大体而言,美国的比较优势是技术创新,中国则是在此基础上的创新应用和制造。
在技术和应用的产业化层面,中国与美国类似,GAI产业化路径大致分为两类:平台级巨头以提供通用大模型为主,技术创新公司则专注于挖掘垂直领域细分场景的软硬件解决方案需求;两者的差异是美国拥有软硬件GAI技术的主导权:既有英伟达、AMD等提供超级算力的硬件公司,也有OpenAI这种AI基础前沿技术探索的领导者。
来自中国合肥的AI创业公司——未来智能,就是这种产业路径的代表:致力于开发的办公会议耳机,即为类ChatGPT平台商业化做出的结果呈现,也是为之实现商业价值的生态系统,提供垂直场景数据和训练迭代的智能终端。
未来智能CEO马啸说,“现在的经验表明,未来AI技术,在越垂直的地方,产生的价值越大。”故而技术创新的技术指向,不必追求无限扩散,收得住,深耕垂域更有价值。
未来智能发布的新一代讯飞会议耳机iFLYBUDS Pro 2等新品,是未来智能在垂直细分场景持续做功的最新证明。
“在AIGC领域,垂直场景的服务性工具比泛智能工具实用性更强。”马啸说,“未来智能在垂直的办公会议领域,已经形成了数据的马太效应,打造出了非常实用的AI会议助理。”
马啸的表达包含三层意思。
首先,马啸再次强调未来智能办公会议耳机的技术逻辑和产业价值。
中国式ChatGPT,可能的演进路径是数家像百度、腾讯或阿里那样的大厂负责平台搭建;在这些平台上,要有“大量基于垂直领域的微调模型,在中国式ChatGPT上做垂直领域服务。
未来智能长期做功的办公会议耳机品类,立足于细分的办公会议场景,解决办公场景录音、记录、文字转化或语言翻译等多种问题,目的是帮助会议参与人提升办公效率。
其次,随着目标用户——城市白领、政府官员、律师、记者、外贸从业人员、跨国公司管理和券商分析师等群体,高频应用这些耳机,实际上相当于形成垂直领域多种职业的特定语义标签并做了参数提炼,故而有能力构建大规模的海量办公数据(库)。
数据的价值,无与伦比。
“从大模型的第一性原理来看,一个大模型需要三个要素:算力,算法和数据。”未来智能CTO王松说,“其中,数据是关键。”
马啸做了进一步阐述:“我们做的是垂直场景。如果坚持深耕场景,那在这个场景上我们可以收集整理的数据就会很多。我们的耳机不是全职全能的,我们只要在这个场景上比别人强就可以。”
成为更自然的AI个人助理
与2023年未来智能推出iFLYBUDS Nano系列办公会议耳机相比,此次推出的“iFLYBUDS Pro 2、iFLYBUDS 2和Kit 2”,背后的技术和商业思考也有迭代。
任何终端产品,在功能表面的背后,都有着技术逻辑的变化和商业价值的考量。
选用什么样的技术,要结合成本、解决问题或满足需求的广度和深度、技术发展阶段、供应链技术能力、不同的商业策略和目标等多种因素。这些因素综合起来,最终形成让B端或C端用户能看到或感知到的商业产品。
那么,这次未来智能带来的三款新品,技术和商业思考迭代是什么?对C端用户的增量价值又是什么?
这就涉及马啸那个表达的第三层含义:“我们打造出了非常实用的AI会议助理”。显然,核心迭代是“AI会议(个人)助理”。同时,这个迭代还包遵循着未来智能做产品研发时的三个核心指导要素:更自然、更高效、更可靠。
要明了这个全新迭代的技术原生点,可以从未来智能CPO柳达对他们研发的办公会议耳机的价值思考入手。
总体来说,柳达认为,未来智能在推动GAI技术为提高C端用户生产效率的过程中,创造的最大价值,首先是通过技术平台,实现高价格的优质高价值服务的平权化。
举个例子:现在请得起私人秘书或助理的人并不多,只是一小部分,但随着GAI技术的发展,通过工具形式(智能终端),让每个人拥有一个拥有真人智慧的智能AI助理或AI秘书,帮助C端解决各种工作甚至生活问题,这就叫平权。
未来智能推出的办公会议耳机,其GAI技术的可感知入口被称为“viaim AI”。这个入口拥有的能力,将成为未来智能所有耳机品类的标配。故而,未来智能品类繁多的耳机由此构成一个技术平台,在客观上能达成原本高价格的优质高价值服务的平权化。
“这是未来(智能)的发展方向。我们要做的就是让产品最终要变成用户的助理,像真人助理一样,拥有五感六观,可以看到、听到、感知到,并最终完成用户‘交代’的工作。”柳达说,“这也是我们会持续探索的商业模式。”
个人秘书或助理,要完成的工作涉及面非常广。除了常见的会议记录、做会议摘要、安排工作行程等,眼下的高频强需求——比如一些手机提供的实时翻译功能,未来智能办公会议耳机也有此项功能。
与手机的文本翻译不同,未来智能讯飞会议耳机的翻译应用,遵循着“更自然”原则。这对C端用户的价值显而易见:拥有实时翻译(同传)能力——中国人A说中文,法国人B能看到法文;同时,B说法语,A能通过耳机,听到中文。
于此同时,讯飞会议耳机的viaim AI,这一次新升级了“有问必答”功能,带来更有效和精准的交互:在viaim AI界面,语言/文字输入问题,viaim AI就能基于记录信息快速回复问题,便于用户查询会议信息,这进一步提升了用户效率,也能切实解决用户问题。
这是未来智能此次推出的耳机新品拥有的平台级技术应用能力。
更高效,主要涉及长录音文件的要点摘要一键达成,以及核心要点的一键获取;更可靠,就是用户个人数据的安全性:即Catefirst,未来智能将用于训练的数据和用户个人数据做技术区隔。
对于用户个人数据的应用,就外部性而言,未来智能将决定权交给用户。如果用户授权,则可以将之用于应用体验的具象优化,反之则做抽象优化。
举个例子:如果用户授权,比如打勾,就相当于给耳机做了一次训练;如果打叉,那也是训练,相当于告诉耳机,结果不准确;如果既不打勾也不打叉,则说明用户对此项应用没意见,也可能没兴趣。