周四,据媒体报道,扎克伯格旗下Meta Platforms推迟发布旗舰AI模型Behemoth。Meta的工程师们在显著提升其大型语言模型Behemoth的能力方面遇到困难,员工们质疑其相较前代模型的进步是否足以支撑公开发布。
在还处于早期开发时,Meta内部计划于4月发布Behemoth,以配合Meta首次为开发者举办的AI大会。Meta在该活动前发布了Llama AI模型系列中的两个小型模型,但更大的Behemoth版本发布被推迟至6月。现在,该模型发布时间又被推迟到秋季甚至更晚。
需要注意的是,扎克伯格及其他Meta高管并未公开承诺Behemoth的发布时间。公司最终可能决定提前发布Behemoth,包括推出一个功能受限的版本。但Meta的工程师和研究人员担心其表现不符合此前对外宣称的能力。
Meta曾公开“吹捧”Behemoth的能力,声称其在某些测试中已经超过OpenAI、Google和Anthropic的同类技术。但内部人士表示,该模型的性能受制于训练过程中的困难。
Meta发言人拒绝对此置评。
Meta将推迟发布旗舰AI模型Behemoth,引发了内部对于其数十亿美元AI投资方向的担忧。Meta计划今年资本支出最高可达720亿美元,其中大部分将用于实现CEO扎克伯格在AI方面的宏伟目标。
下图为Meta的资本支出情况:
下图为大型科技公司近年来的资本支出趋势,市场担心这种趋势并不可持续:
周四的消息出炉后,Meta股价盘中跌超3%,英伟达盘中也出现明显回落,并且拖累纳指当日收跌。
Meta不满AI产品组表现
Meta的第一代Llama模型由其基础AI研究团队开发,该团队主要由博士研究人员组成,并于2023年初对外发布模型及研究论文。然而此后,参与该论文的14名研究者中已有11人离开Meta公司。后续Llama模型则由另一团队开发。媒体报道称,Meta近期的一些Llama模型也存在问题。
4月发布的两个Llama模型起初在一个受欢迎的AI聊天机器人排行榜上表现良好,但后来被发现,提交至排行榜的并非公开发布的同一模型。
排行榜的代表称,Meta应更明确地说明他们提交的是一个针对测试进行过优化的定制模型。扎克伯格承认,Meta提交给排行榜的AI模型是专门优化过以便在第三方测试中取得好成绩的版本。
据知情人士称,Meta公司高层对开发Llama 4模型的团队表现感到失望,并将Behemoth进展缓慢归咎于该团队。因此,Meta正在考虑对其AI产品组进行重大管理调整。
未来AI模型的进步可能会比以往慢得多
Meta此前因快速追赶全球AI竞赛对手而受到赞誉,并在此过程中投入巨资,开发在WhatsApp、Instagram和Facebook上的聊天机器人技术。
Meta推迟发布旗舰AI模型Behemoth,凸显其当前面临的困境,也反映出其他顶尖公司在发布下一代AI先进模型过程中遇到的挫折或延误。一些研究人员认为,这种趋势表明未来AI模型的进步可能会比以往慢得多,且成本极高。“目前来看,各个实验室、各种模型的进展都非常小。”
OpenAI的下一代重磅模型GPT-5原本预计在2024年中期发布。去年12月,报道称该模型的开发进度落后于计划。今年2月,OpenAI首席执行官Sam Altman表示,将发布的是GPT-4.5,而GPT-5这一寄望于实现更大技术突破的模型还需数月时间。ChatGPT目前运行的是GPT-4o版本。OpenAI拒绝就GPT-5的发布时间发表评论。
Anthropic去年宣布正在研发名为Claude 3.5 Opus的新模型,是其去年发布并持续更新的AI模型的更大型版本。该模型目前仍未发布,一位发言人表示“即将推出”。