新模型最大亮点,GPT-4o语音功能或大范围推送,AI音箱也有望崛起

一、事件:GPT-4o的高级语音模式开放

OpenAI日前宣布,预计今年秋天会向所有智能音箱 Plus用户开放GPT-4o的高级语音模式。

语音模式GPT-4o是主打功能,它允许用户与AI进行更加自然和流畅的对话,支持超过50种语言,能提供实时翻译、唱歌、练习口语、做数学题、讲笑话等。

7月底,OpenAI已开始向一小部分智能音箱 Plus用户推出高级语音模式。其高级语音模式最大的亮点就是“自然”和“实时”。与GPT-4o对话的过程中,你可以随时打断对话,它还能感知并回应你的情绪波动。

应用场景广泛

国泰君安,从测试用户反馈来看,部分用户利用GPT-4o进行口语练习,GPT-4o将针对用户发音进行实时评分,多种语言测试下都有稳定表现。

情感方面,在对GPT-4o讲笑话时,它将提供笑声陪伴,及时给予情绪反馈;GPT-4o能实现在讲故事的同时创建背景声,增加沉浸感;还有用户结合视频功能向GPT-4o展示了宠物猫的情况,GPT-4o也能够积极回应。

其认为,GPT-4o的高级语音、视频等功能将助力教育及情感陪伴相关应用的功能迭代,甚至改变人机交互方式。

百亿空间待升级

国联证券指出,随着智能音箱等全新语言模型的到来,无论是对更加复杂语言的推理和分析,还是优秀的对话连贯性和流畅性,或是所能提供的更加个性化的服务,均有希望延展到上。智能音箱使从自动理解、生成语言,到进行流畅的对话和问答,都可以给用户提供更加全面、更加智能、更加个性化的服务,发展有望拉动迎来新一轮的飞跃。

市场空间来看,德邦证券表示,是AI体验改善弹性最大的硬件明确的场景和使用痛点亟需技术进步,市场需求驱动&技术涌现,出货有望大幅提升。根据Statista/MRFR等数据,2022年全球出货量为1.2亿台,市场规模为102亿美元。

头部公司布局方面,华福证券统计:

1)苹果拟打造桌面机器人+Siri:根据硅星GenAI,HomeAccessory可能拥有一个大尺寸的iPad显示屏,该设备将使用高级版Siri进行语音控制,使其成为智能家居的控制终端。

2)谷歌Home+Gemini:根据36氪报道,新的摄像头智能功能,它可以为Nest摄像头的视频片段自动生成描述性字幕;自然语言输入功能,用于在GoogleHome里创建程序;更智能的GoogleAssistant,它将适用于Nest和显示器,并且配备新的语音选项。

3)小爱音箱+小爱:8月30日,根据快科技报道,小米澎湃OS官方宣布向多款小爱音箱推送升级的大模型小爱。全新小爱更加聪明智能,并拥有更大而全的知识库。

二、历史龙头表现

当地时间5月13日,OpenAI在其春季更新活动中正式推出支持全新模型GPT-4o的智能音箱版本。5月14日,AI语音交互相关个股走强,汤姆猫盛通股份等涨停。

三、相关公司

据华福证券:

AI语音应用端:AI陪伴、AI陪聊、AI教育、AI游戏公司,包括:汤姆猫昆仑万维世纪天鸿宝通科技

AI语音助手硬件入口:AI手机、AI PC和AI公司,包括漫步者国光电器

德邦证券表示,AI语音交互趋势下,高信噪比MEMS麦克风迎来新机遇:歌尔股份敏芯股份共达电声

另外国内号称“国内首个能力追齐GPT-4o语音能力的模型”,心辰Lingo语音AI模型8月24日开放内测预约,A股公司汤姆猫参股。

风险提示及免责条款
市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。