OpenAI大动作即将公布,语音新技术或是核心

OpenAI将于5月13日周一太平洋时间10点(北京时间周二凌晨)进行一场线上直播。

其CEO奥特曼表示直播内容除了智能音箱、GPT-4一系列更新外,预计还将发布全新的AI语音助手,不过并不会有此前热传的“AI搜索”。

OpenAI认为,具有视觉和听觉功能的助手有可能像智能手机一样带来变革。它可以观察用户所处的环境信息,提供建议,潜在的用例如充当家庭教师、翻译标志、修理汽车等等。同时据媒体爆料,从OpenAI网站一些后台代码就可以发现,OpenAI似乎正在努力在智能音箱中实现电话通话。

此外媒体称,苹果接近与OpenAI达成协议,将智能音箱应用于iPhone。苹果预计在下月的WWDC上展示其AI领域的最新成果,其中备受瞩目的Siri语音助手将迎来重大升级,以更具对话性和多功能性的全新姿态亮相。

Siri的此次升级将基于一个全新的生成式AI系统。该系统不仅将增强Siri的语言理解能力,还将赋予其更自然的聊天功能,使其能够更流畅、更智能地与用户进行交互。

媒体称,经测试,苹果高管发现,相较于智能音箱,Siri“看起来已经过时了”,智能音箱等聊天机器人背后的大语言模型技术可以增强Siri的能力。

据诚思咨询统计,全球范围内,2022年智能语音产业规模预计达到351.2亿美元,年增长率高达33.1%。而在中国,2022年智能语音市场规模预计将达到341亿元人民币,同比增长13.4%。这一数据充分说明了国内外市场对于智能语音技术的强烈需求和高度认可。

手机AI语音、迎新契机

民生证券指出,音频作为轻交互的方式,更适用于碎片化场景,而以智能音箱为代表的生成式AI系统将不断优化提升智能语音交互反馈的丰富度和准确性,大大改善消费者体验,为&耳机等可穿戴设备的进一步渗透打开成长空间。其中经过近10年发展,已具备一定用户基础和发展空间。

方正证券也表示,是语音交互的典型独立载体。市面上的设备的技能基本完善,主要功能包括提供有声服务、连接家中其他家具并控制、提供多种生活技能(定闹钟、安排日程、查询天气,语音沟通)等。

目前我国渗透率较低,市场对于的接受度和需求度均具有巨大的潜力。但由于智能化不足,使用过程中,仍然存在许多限制导致的功能处于尴尬地位。

而智能音箱这类生成式AI具有智能对话、多模态表达的支持,对于都是可以弥补缺陷的方案。其预计智能音箱为代表的语音AI技术开始在领域落地后,其对出货量的影响将在2年内逐步释放,并从存量更换加速和净新增用户增加两个层面带来出货量增量。

此外方正证券指出,手机语音助手仍是尚未被重视的语音交互入口。数据显示,美国、英国、德国的用户中每天使用的不超过35%,另外还有40%-50%的用户根本未成为用户,这一使用频率的分布相比智能手机终端覆盖率明显偏低。

中金公司表示,虽然Siri、小爱同学等手机语音助手也在特定场景能够发挥作用,但语音形式并未成为主导模式。从提升交互效率的角度看,AI长期将改变人机交互的方式,未来人机交互的模式有望从文本进化到语音等方式,用户可以通过语音进行手机操作,同时人机交互也将呈现多模态结合的特点。

未来随着基于大模型的各类小模型及应用在移动端落地,在带动手机硬件升级的基础上,有望激发消费者换机升级热情。Counterpoint预测,2027年全球AI手机渗透率约40%,出货量有望达5.22亿部。

风险提示及免责条款
市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。