7*24 快讯

报道:OpenAI整合团队开发音频AI模型,为发布AI个人设备铺路

据知情人士透露,OpenAI正采取措施优化其音频AI模型,为未来发布由AI驱动的个人设备做准备。三名知情人士表示,该设备预计将主要依赖音频交互。

目前,当用户与ChatGPT对话时,虽然聊天机器人能进行语音回复,但其语音版本与文本版本使用的底层模型并不相同。OpenAI内部研究人员认为,当前语音模型在回答准确性和响应速度上均落后于文本模型。

风险提示及免责条款
市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。

为应对这一挑战,过去两个月内,OpenAI已整合了工程、产品和研究团队,共同推进音频模型的优化。提升语音模型准确性对OpenAI至关重要,因其计划推出一款支持语音指令的消费级设备。

音频AI项目的核心人物是今夏从Character.AI加入的语音研究员Kundan Kumar,其他负责人包括重构音频AI基础设施的产品研究主管Ben Newhouse,以及多模态ChatGPT产品经理Jackie Shannon。

该模型目标发布时间为2026年第一季度

OpenAI计划逐步发布一系列设备(如眼镜、无屏智能音箱),而非单一产品。(The Information)

风险提示及免责条款
市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。