挑战GPT!Meta推出最强开源模型Llama 3,社交媒体全线配“最智能”免费AI助手

硬AI
Llama 3最大参数规模超4000亿,训练token超15万亿,对比GPT-3.5多种人类评估测评胜率超六成;亚马逊、微软、谷歌云将推出Llama 3,英伟达、英特尔、AMD硬件平台将支持Llama 3。英伟达称,Meta用搭载超2.4万块H100芯片的计算机集群训练Llama 3。Meta AI助手将在美国以外十三国推出英语版,手机和电脑均可用,用它查询无需切换App,文生图功能Image可根据提示词实时更新图片、可生成GIF动图。

本文作者:李丹

来源:硬AI

OpenAI的GPT迎来强劲对手,Meta正在发起最新一轮挑战。

美东时间4月18日周四,Meta宣布,推出旗下第三代大语言模型(LLM)Llama 3,称它为“迄今为止能力最强的开源LLM”,并且基于Llama 3,升级了人工智能(AI)助手Meta AI,称它“现在是你可以免费使用的最智能AI助手”。

Meta公布,Llama 3将在亚马逊、微软、谷歌云等云平台得到启用,并得到英伟达等芯片巨头和戴尔的硬件支持。英伟达透露,Meta在合计搭载超过2.4万块H100芯片的计算机集群上训练Llama 3,英伟达产品和服务加持的Llama 3用于云、边缘计算、机器人、PC等领域。

社交媒体X的用户评论称,Meta是AI领域定位最好的公司之一,与谷歌不同的是,它的商业模式不是可以被AI颠覆的,而是可以被AI显著增强的。

但也有网友泼冷水,称不会用Meta的AI助手,不需要Meta的人审查。 

Llama 3最大参数规模超4000亿 训练token超15万亿

去年7月Meta发布的Llama 2有三个版本,最大版本70B的参数规模为700亿。本周四Meta介绍,Llama 3有8B和70B两个版本。Meta CEO扎克伯格称,大版本的Llama 3将有超过4000亿参数。Meta并未透露会不会将4000亿参数规模的Llama 3开源,目前它还接受训练。

对比前代,Llama 3有了质的飞跃。Llama 2使用2万亿个 token进行训练,而训练Llama 3大版本的token超过15 万亿。

有X网友感慨,当Meta停止训练时,Llama 3 “仍在”学习,说Meta之所以停下来,只是因为他们决定,需要GPU开始测试Llama 4。AI的扩展法则真是疯狂。

Meta称,由于预训练和训练后的改进,其预训练和指令调优的模型是目前8B和70B两个参数规模的最佳模型。在训练后程序得到改进后,模型的错误拒绝率(FRR)大幅下降,一致性提高,模型响应的多样性增加。 在推理、代码生成和指令跟踪等功能方面,Llama 3相比Llama 2有极大改进,使Llama 3更易于操控。

下图可见,8B和70B版本的Llama 3指令调优模型在大规模多任务语言理解数据集(MMLU)、研究生水平专家推理(GPQA)、数学评测集(GSM8K)、编程多语言测试(HumanEval)等方面的测评得分都高于Mistral、谷歌的Gemma和Gemini和Anthropic的Claude 3。

8B和70B版本的预训练Llama 3多种性能测评优于Mistral、Gemma、Gemini和Mixtral。

Meta称,开发了一套新的高质量人类评估集,包括涵盖12 个关键用例的1800个提示词,这些用例分别是寻求建议、头脑风暴、分类、闭卷问答、开卷问答、编码、创意写作、提取、塑造角色/人物形象、推理、改写和总结。下图可见,在人类评估集测评中,70B版本指令调优Llama 3优于Claude Sonnet、Mistral Medium、GPT-3.5和Llama 2的胜率分别为52.9%、59.3%、63.2%、63.7%。

为了未来适用于多语言用例,超过5%的 Llama 3 预训练数据集属于涵盖30 多种语言的高质量非英语数据。但Meta预计,对非英语语种的性能不会和英语的一致。

Meta预计。未来几个月,将推出Llama 3 的新功能,上下文窗口会更长,性能会更强,还会有该模型新的尺寸版本,Meta还将分享 Llama 3的研究论文。

X平台有评论称,根据基准测试,目前的Llama 3模型不完全是 GPT-4 级别的,但仍在训练中的较大尺寸的模型将达到 GPT-4 级别。

亚马逊等云平台将推出Llama 3 超2.4万英伟达H100芯片训练Llama 3

Meta介绍,Llama 3 模型很快将在亚马逊云AWS、Databricks、谷歌云、Hugging Face、Kaggle、IBM的云平台WatsonX、微软云Azure、英伟达的NIM和 Snowflake 上推出,得到 AMD、AWS、戴尔、英特尔、英伟达提供的硬件平台支持。

英伟达同日披露,Meta的工程师在包含2.4576万块英伟达H100 Tensor Core GPU、连接英伟达Quantum-2 InfiniBand网络的计算机集群上训练 Llama 3。 在英伟达的支持下,Meta 为其LLM调整了网络、软件和模型架构。而且,为了进一步推进生成式AI的先进水平,Meta最近公布了计划,要在其基础设施用应用35万块H100 芯片。

英伟达称,由英伟达芯片助力的Llama 3现已推出,可用于云、数据中心、边缘计算和个人电脑(PC)。开发人员可以通过英伟达的网站ai.nvidia.com试用Llama 3,企业用户可以通过英伟达的端到端云原生框架NeMo,利用自身数据对 Llama 3进行调优。

Llama 3 还可在英伟达用于机器人开发的模组Jetson Orin 上运行,用于机器人和边缘计算设备,创建像Jetson AI 实验室中的交互式代理。此外,适用于工作站和 PC 的 NVIDIA RTX 和 GeForce RTX GPU可加快 Llama 3的推理速度。

美国以外十三国推出英语版Meta AI 手机和电脑均可用 文生图功能Image可实时更新图、生成GIF

Meta介绍,用户可以在旗下社交媒体Facebook、Instagram、WhatsApp 和 Messenger上使用 Meta AI完成工作、学习、创作和连接自己看重的事物。

Meta称,将在美国以外的十三个国家推出英语版 Meta AI,包括加拿大、澳大利亚、新西兰、新加坡、南非、尼日利亚、巴基斯坦、加纳、牙买加、马拉维、乌干达、赞比亚和津巴布韦。

Meta AI能做什么?Meta举了一些例子,比如策划和朋友晚上怎么玩,推荐一家可欣赏日落美景并提供素食选择的餐厅,查找周末晚上哪里有音乐会,提供野餐地点的建议,解释遗传特征如何发挥作用这种课业问题。

Meta还提到一个新功能——名叫Image的AI图像生成功能,用户可以根据WhatsApp 和 Meta AI 网站中的文本生成图像。用这种功能,Meta AI 可以根据用户想要的审美要求“想象”生成图片,给用户的实际购物提供灵感。

扎克伯格表示,Image服务将在用户输入更详细的提示词时实时更新图像,并可以创建自定义动画GIF。

Meta称,当用户开始打字输入提示词时,会看到一个图像出现,并且每输入几个字母,这个图就会发生变化。

Meta介绍,如果用户找到喜欢的图片,可以让 Meta AI 为其制作动画,或者转换为GIF图片与朋友分享。

除了手机用户,Meta还兼顾电脑用户,上线了网站meta.ai,让用户在电脑上完成工作时也可以使用 Meta AI,让它帮忙解数学题,让工作电邮的内容更专业。用户还可以登录网站保存与Meta AI 的对话内容,供将来参考。

Meta AI 还可以在 Facebook、Instagram、WhatsApp 和 Messenger上进行网页实时搜索。用户可以通过网络访问实时信息,无需在这些社交媒体的应用程序App之间切换。假用户正在 Messenger 群聊时计划怎么安排滑雪旅行。使用Messenger 中的搜索,可以要求 Meta AI 查找从纽约飞往科罗拉多州的航班,找出出行人数相对最少的周末,所有这些查找工作都无需离开 Messenger的App进行。

滚动浏览Facebook Feed 时,用户也可以访问Meta AI。如果发现感兴趣的帖子,用户可以在打开帖子后直接问Meta AI获取更多相关信息。比如看到冰岛北极光的照片,可以询问 Meta AI 一年中的什么时间最适合观看北极光。

 

本文来自微信公众号“硬AI”,关注更多AI前沿资讯请移步这里

风险提示及免责条款
市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。
相关文章