Meta计划7月发布Llama 3,能力接近GPT-4,最高1400亿参数

硬AI
Meta希望Llama 3能够比肩GPT-4,但尚未决定是否将其开发成多模态模型。参数最高1400亿,不到GPT-4的十分之一。

作者:卜淑情

来源:硬AI

当地时间周三,科技媒体The Information援引知情人士报道,Meta计划在今年7月份发布Llama 3大模型。

Llama 3肩负的使命巨大。

报道称,Meta希望Llama 3能够比肩OpenAI的GPT-4,后者已经成为一个强大的多模态模型,不仅能够处理更长的文本,还支持图像输入。

但Meta的一位员工透露,由于研究人员尚未开始对模型进行微调,因此公司尚未决定Llama 3是否是多模态的。微调是开发人员为现有模型提供额外数据的过程,以便大模型学习新信息或处理任务。

Meta员工还说,Llama 3最高可能拥有超过1400亿个参数,相比之下,去年7月发布的Llama 2的参数最高为700亿。

据此前报道称,GPT-4模型参数规模约为1.8万亿,Llama 3不到这一数字的十分之一。

另外,在推出Llama 3之前,Meta还在尝试克服Llama 2中发现的一个问题——无法处理任何有争议的问题。

由于开发人员在Llama 2中增加了安全护栏,它会拒绝回答一系列被认为有争议的问题。

据Meta员工称,这些护栏使得Llama 2在公司高层领导以及模型研究人员眼中显得“过于安全”,研究人员计划放松Llama 3在这一方面的限制,以便它更多地与用户互动,提供背景信息,而不仅仅是拒绝回答。

人们对Llama 3的期待与日俱增,但Meta仍面临着旷日持久的人才竞争。

两名知情人士称,负责Llama 2和Llama 3安全工作的研究员Louis Martin已于本月离开公司。其中一位知情人士称,强化学习负责人Kevin Stone也在本月离职。

风险提示及免责条款
市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。