最强开源大模型！Llama 3下周“小试牛刀”？

2024-04-09 08:15

701

报道称，正式版Llama 3将支持多模态处理，先行推出的两个小版本则不具备这一能力。

当地时间周一，科技媒体The Information援引一位Meta员工消息报道称，该公司计划在下周推出两个小型的Llama 3大语言模型（LLM），作为夏季推出正式版Llama 3的先行版本。

这两个小模型的发布，预计将为Llama 3的正式亮相进行铺垫。Meta在去年7月份发布了Llama 2，此后，包括谷歌、马斯克旗下的xAI与Mistral等在内的数家公司发布了开源的大语言模型，竞争十分激烈。

Llama 3直接对标OpenAI的GPT-4，后者已经成为一个强大的多模态模型，不仅能够处理更长的文本，还支持图像输入。

报道称，正式版Llama 3也将支持多模态处理，即同时理解和生成文本及图片；而先行推出的两个小版本则不具备这一能力。

一般而言，较小的模型成本更低，运行更快，尤其在运行大型模型成本高昂的当下，其价值尤为凸显。小型模型还便于开发者在移动设备上开发人工智能软件。

Meta此前已推出三个版本的Llama 2，其中最大的一个拥有700亿个参数，另外两个版本分别拥有130亿和70亿个参数。

Meta还将在Llama 3中改进Llama 2在响应争议性话题时过于保守的问题，研究人员计划放松大模型在这一方面的限制，以便它更多地与用户互动，提供背景信息，而不仅仅是拒绝回答。

风险提示及免责条款

市场有风险，投资需谨慎。本文不构成个人投资建议，也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资，责任自负。