据知情人士透露,OpenAI正采取措施优化其音频AI模型,为未来发布由AI驱动的个人设备做准备。三名知情人士表示,该设备预计将主要依赖音频交互。
目前,当用户与ChatGPT对话时,虽然聊天机器人能进行语音回复,但其语音版本与文本版本使用的底层模型并不相同。OpenAI内部研究人员认为,当前语音模型在回答准确性和响应速度上均落后于文本模型。
据知情人士透露,OpenAI正采取措施优化其音频AI模型,为未来发布由AI驱动的个人设备做准备。三名知情人士表示,该设备预计将主要依赖音频交互。
目前,当用户与ChatGPT对话时,虽然聊天机器人能进行语音回复,但其语音版本与文本版本使用的底层模型并不相同。OpenAI内部研究人员认为,当前语音模型在回答准确性和响应速度上均落后于文本模型。
为应对这一挑战,过去两个月内,OpenAI已整合了工程、产品和研究团队,共同推进音频模型的优化。提升语音模型准确性对OpenAI至关重要,因其计划推出一款支持语音指令的消费级设备。
音频AI项目的核心人物是今夏从Character.AI加入的语音研究员Kundan Kumar,其他负责人包括重构音频AI基础设施的产品研究主管Ben Newhouse,以及多模态ChatGPT产品经理Jackie Shannon。
该模型目标发布时间为2026年第一季度。
OpenAI计划逐步发布一系列设备(如眼镜、无屏智能音箱),而非单一产品。(The Information)