周四,OpenAI的CEO Sam Altman在Reddit AMA活动中透露,备受期待的下一代大型AI模型GPT-5可能不会在今年发布,因为公司正在“优先考虑交付”专注于推理和难题的现有模型。
Altman表示,由于模型变得日益复杂,公司无法像预期那样快速推出新版本。他指出,公司面临的挑战之一是“我们如何分配我们的计算资源以支持许多伟大的想法”。
据报道,OpenAI一直在努力确保足够的计算基础设施来运行和训练其生成式AI模型。本周,据路透社援引消息人士的话称,OpenAI已经与博通合作数月,共同开发一款用于运行模型的AI芯片,该芯片可能最早在2026年问世。
但OpenAI内部的许多人认为GPT-4o还没有准备好公开发布。
由于计算能力的紧张,Altman表示ChatGPT的高级语音模式短期内不会配置最初在4月份展示的视觉功能,即对手机摄像头视野内的视觉提示(如某人穿着的衣服)做出反应。《财富》杂志此前报道称,该演示是为了转移人们对同周举行的谷歌I/O开发者大会的注意力而匆忙推出的。
除此之外,该模型的高级语音模式的纯语音版本已被推迟数月。Altman还暗示了OpenAI的图像生成器DALL-E的下一个主要版本还没有“发布时间表”:
“我们还没有发布计划。”
OpenAI的工程副总裁Srinivas Narayanan称,ChatGPT的相机模式也没有“确切的发布日期”。
与此同时,OpenAI的视频生成工具Sora受到了“需要完善模型、确保安全/模仿/其他事项正确,以及扩展计算能力”的阻碍,与Luma、Runway等竞争对手的系统相比处于劣势。据The Information报道,2月份展示的原始系统制作1分钟的视频剪辑需要超过10分钟的处理时间。
值得注意的是,10月份,Sora的共同负责人之一Tim Brooks离开了OpenAI,转投谷歌。
不过,Altman似乎很乐观,他表示,公司的首要任务是改进其o1系列的“推理”模型及其后续版本。本周在伦敦举行的DevDay开发者大会上,OpenAI还预览了即将推出的o1系列的多项功能,包括图像理解。Altman写道:
“我们今年晚些时候会有一些非常好的发布。不过,我们不会称之为GPT-5。”