昨天OpenAI开发者关系负责人Romain Huet在旧金山AI工程师世界博览会上的做了一个演讲,主要介绍了多模态AI模型的最新进展及其应用.
Open AI开发者关系负责人Romain Huet 演示了多个ChatGPT的实时语音和多模态的能力,主要提及了以下几点:
1)Sora居然支持克隆你自己的声音对生成的视频配音,可以用你的声音说多种语言
2)ChatGPT实时语音的演示,包括调整说话语气,快速摄像头OCR内容识别,随时打断的能力
3)ChatGPT 桌面内容共享和剪切板共享帮助编写代码和Debug
4)下一个模型GPT Next,根据时间轴上写的2024,看来年底肯定发布了,GPTNext 大约比 GPT4 智能 2 倍
OpenAI未来重点发展领域
Romain Huet透露OpenAI未来重点关注四大领域
提高文本智能:尽管多模态发展迅速,但提升文本智能仍是关键,未来模型的推理能力将大幅提高
更快更便宜的模型:OpenAI计划推出不同大小和价格的模型,以满足不同的需求
模型定制化:OpenAI提供了广泛的定制化服务,包括微调API,帮助企业根据自身需求定制模型
代理技术:OpenAI致力于发展能够使用多模态与世界互动的AI代理,提升其感知和管理能力
本文作者:opencat,文章来源:AI寒武纪,原文标题:《GPT-Next:OpenAI下一个模型,智能为GPT-4两倍》。
风险提示及免责条款
市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。