一、事件:GPT-4o的高级语音模式开放
OpenAI日前宣布,预计今年秋天会向所有智能音箱 Plus用户开放GPT-4o的高级语音模式。
语音模式GPT-4o是主打功能,它允许用户与AI进行更加自然和流畅的对话,支持超过50种语言,能提供实时翻译、唱歌、练习口语、做数学题、讲笑话等。
7月底,OpenAI已开始向一小部分智能音箱 Plus用户推出高级语音模式。其高级语音模式最大的亮点就是“自然”和“实时”。与GPT-4o对话的过程中,你可以随时打断对话,它还能感知并回应你的情绪波动。
应用场景广泛
据国泰君安,从测试用户反馈来看,部分用户利用GPT-4o进行口语练习,GPT-4o将针对用户发音进行实时评分,多种语言测试下都有稳定表现。
情感方面,在对GPT-4o讲笑话时,它将提供笑声陪伴,及时给予情绪反馈;GPT-4o能实现在讲故事的同时创建背景声,增加沉浸感;还有用户结合视频功能向GPT-4o展示了宠物猫的情况,GPT-4o也能够积极回应。
其认为,GPT-4o的高级语音、视频等功能将助力教育及情感陪伴相关应用的功能迭代,甚至改变人机交互方式。
百亿空间待升级
国联证券指出,随着智能音箱等全新语言模型的到来,无论是对更加复杂语言的推理和分析,还是优秀的对话连贯性和流畅性,或是所能提供的更加个性化的服务,均有希望延展到上。智能音箱使从自动理解、生成语言,到进行流畅的对话和问答,都可以给用户提供更加全面、更加智能、更加个性化的服务,发展有望拉动迎来新一轮的飞跃。
市场空间来看,德邦证券表示,是AI体验改善弹性最大的硬件明确的场景和使用痛点亟需技术进步,市场需求驱动&技术涌现,出货有望大幅提升。根据Statista/MRFR等数据,2022年全球出货量为1.2亿台,市场规模为102亿美元。
头部公司布局方面,华福证券统计:
1)苹果拟打造桌面机器人+Siri:根据硅星GenAI,HomeAccessory可能拥有一个大尺寸的iPad显示屏,该设备将使用高级版Siri进行语音控制,使其成为智能家居的控制终端。
2)谷歌Home+Gemini:根据36氪报道,新的摄像头智能功能,它可以为Nest摄像头的视频片段自动生成描述性字幕;自然语言输入功能,用于在GoogleHome里创建程序;更智能的GoogleAssistant,它将适用于Nest和显示器,并且配备新的语音选项。
3)小爱音箱+小爱:8月30日,根据快科技报道,小米澎湃OS官方宣布向多款小爱音箱推送升级的大模型小爱。全新小爱更加聪明智能,并拥有更大而全的知识库。
二、历史龙头表现
当地时间5月13日,OpenAI在其春季更新活动中正式推出支持全新模型GPT-4o的智能音箱版本。5月14日,AI语音交互相关个股走强,汤姆猫、盛通股份等涨停。
三、相关公司
据华福证券:
AI语音应用端:AI陪伴、AI陪聊、AI教育、AI游戏公司,包括:汤姆猫、昆仑万维、世纪天鸿、宝通科技;
AI语音助手硬件入口:AI手机、AI PC和AI公司,包括漫步者、国光电器。
德邦证券表示,AI语音交互趋势下,高信噪比MEMS麦克风迎来新机遇:歌尔股份、敏芯股份、共达电声。
另外国内号称“国内首个能力追齐GPT-4o语音能力的模型”,心辰Lingo语音AI模型8月24日开放内测预约,A股公司汤姆猫参股。