本文作者:李丹
来源:硬AI
OpenAI的GPT迎来强劲对手,Meta正在发起最新一轮挑战。
美东时间4月18日周四,Meta宣布,推出旗下第三代大语言模型(LLM)Llama 3,称它为“迄今为止能力最强的开源LLM”,并且基于Llama 3,升级了人工智能(AI)助手Meta AI,称它“现在是你可以免费使用的最智能AI助手”。
Meta公布,Llama 3将在亚马逊、微软、谷歌云等云平台得到启用,并得到英伟达等芯片巨头和戴尔的硬件支持。英伟达透露,Meta在合计搭载超过2.4万块H100芯片的计算机集群上训练Llama 3,英伟达产品和服务加持的Llama 3用于云、边缘计算、机器人、PC等领域。
社交媒体X的用户评论称,Meta是AI领域定位最好的公司之一,与谷歌不同的是,它的商业模式不是可以被AI颠覆的,而是可以被AI显著增强的。
但也有网友泼冷水,称不会用Meta的AI助手,不需要Meta的人审查。
Llama 3最大参数规模超4000亿 训练token超15万亿
去年7月Meta发布的Llama 2有三个版本,最大版本70B的参数规模为700亿。本周四Meta介绍,Llama 3有8B和70B两个版本。Meta CEO扎克伯格称,大版本的Llama 3将有超过4000亿参数。Meta并未透露会不会将4000亿参数规模的Llama 3开源,目前它还接受训练。
对比前代,Llama 3有了质的飞跃。Llama 2使用2万亿个 token进行训练,而训练Llama 3大版本的token超过15 万亿。
有X网友感慨,当Meta停止训练时,Llama 3 “仍在”学习,说Meta之所以停下来,只是因为他们决定,需要GPU开始测试Llama 4。AI的扩展法则真是疯狂。
Meta称,由于预训练和训练后的改进,其预训练和指令调优的模型是目前8B和70B两个参数规模的最佳模型。在训练后程序得到改进后,模型的错误拒绝率(FRR)大幅下降,一致性提高,模型响应的多样性增加。 在推理、代码生成和指令跟踪等功能方面,Llama 3相比Llama 2有极大改进,使Llama 3更易于操控。
下图可见,8B和70B版本的Llama 3指令调优模型在大规模多任务语言理解数据集(MMLU)、研究生水平专家推理(GPQA)、数学评测集(GSM8K)、编程多语言测试(HumanEval)等方面的测评得分都高于Mistral、谷歌的Gemma和Gemini和Anthropic的Claude 3。
8B和70B版本的预训练Llama 3多种性能测评优于Mistral、Gemma、Gemini和Mixtral。
Meta称,开发了一套新的高质量人类评估集,包括涵盖12 个关键用例的1800个提示词,这些用例分别是寻求建议、头脑风暴、分类、闭卷问答、开卷问答、编码、创意写作、提取、塑造角色/人物形象、推理、改写和总结。下图可见,在人类评估集测评中,70B版本指令调优Llama 3优于Claude Sonnet、Mistral Medium、GPT-3.5和Llama 2的胜率分别为52.9%、59.3%、63.2%、63.7%。
为了未来适用于多语言用例,超过5%的 Llama 3 预训练数据集属于涵盖30 多种语言的高质量非英语数据。但Meta预计,对非英语语种的性能不会和英语的一致。
Meta预计。未来几个月,将推出Llama 3 的新功能,上下文窗口会更长,性能会更强,还会有该模型新的尺寸版本,Meta还将分享 Llama 3的研究论文。
X平台有评论称,根据基准测试,目前的Llama 3模型不完全是 GPT-4 级别的,但仍在训练中的较大尺寸的模型将达到 GPT-4 级别。
亚马逊等云平台将推出Llama 3 超2.4万英伟达H100芯片训练Llama 3
Meta介绍,Llama 3 模型很快将在亚马逊云AWS、Databricks、谷歌云、Hugging Face、Kaggle、IBM的云平台WatsonX、微软云Azure、英伟达的NIM和 Snowflake 上推出,得到 AMD、AWS、戴尔、英特尔、英伟达提供的硬件平台支持。
英伟达同日披露,Meta的工程师在包含2.4576万块英伟达H100 Tensor Core GPU、连接英伟达Quantum-2 InfiniBand网络的计算机集群上训练 Llama 3。 在英伟达的支持下,Meta 为其LLM调整了网络、软件和模型架构。而且,为了进一步推进生成式AI的先进水平,Meta最近公布了计划,要在其基础设施用应用35万块H100 芯片。
英伟达称,由英伟达芯片助力的Llama 3现已推出,可用于云、数据中心、边缘计算和个人电脑(PC)。开发人员可以通过英伟达的网站ai.nvidia.com试用Llama 3,企业用户可以通过英伟达的端到端云原生框架NeMo,利用自身数据对 Llama 3进行调优。
Llama 3 还可在英伟达用于机器人开发的模组Jetson Orin 上运行,用于机器人和边缘计算设备,创建像Jetson AI 实验室中的交互式代理。此外,适用于工作站和 PC 的 NVIDIA RTX 和 GeForce RTX GPU可加快 Llama 3的推理速度。
美国以外十三国推出英语版Meta AI 手机和电脑均可用 文生图功能Image可实时更新图、生成GIF
Meta介绍,用户可以在旗下社交媒体Facebook、Instagram、WhatsApp 和 Messenger上使用 Meta AI完成工作、学习、创作和连接自己看重的事物。
Meta称,将在美国以外的十三个国家推出英语版 Meta AI,包括加拿大、澳大利亚、新西兰、新加坡、南非、尼日利亚、巴基斯坦、加纳、牙买加、马拉维、乌干达、赞比亚和津巴布韦。
Meta AI能做什么?Meta举了一些例子,比如策划和朋友晚上怎么玩,推荐一家可欣赏日落美景并提供素食选择的餐厅,查找周末晚上哪里有音乐会,提供野餐地点的建议,解释遗传特征如何发挥作用这种课业问题。
Meta还提到一个新功能——名叫Image的AI图像生成功能,用户可以根据WhatsApp 和 Meta AI 网站中的文本生成图像。用这种功能,Meta AI 可以根据用户想要的审美要求“想象”生成图片,给用户的实际购物提供灵感。
扎克伯格表示,Image服务将在用户输入更详细的提示词时实时更新图像,并可以创建自定义动画GIF。
Meta称,当用户开始打字输入提示词时,会看到一个图像出现,并且每输入几个字母,这个图就会发生变化。
Meta介绍,如果用户找到喜欢的图片,可以让 Meta AI 为其制作动画,或者转换为GIF图片与朋友分享。
除了手机用户,Meta还兼顾电脑用户,上线了网站meta.ai,让用户在电脑上完成工作时也可以使用 Meta AI,让它帮忙解数学题,让工作电邮的内容更专业。用户还可以登录网站保存与Meta AI 的对话内容,供将来参考。
Meta AI 还可以在 Facebook、Instagram、WhatsApp 和 Messenger上进行网页实时搜索。用户可以通过网络访问实时信息,无需在这些社交媒体的应用程序App之间切换。假用户正在 Messenger 群聊时计划怎么安排滑雪旅行。使用Messenger 中的搜索,可以要求 Meta AI 查找从纽约飞往科罗拉多州的航班,找出出行人数相对最少的周末,所有这些查找工作都无需离开 Messenger的App进行。
滚动浏览Facebook Feed 时,用户也可以访问Meta AI。如果发现感兴趣的帖子,用户可以在打开帖子后直接问Meta AI获取更多相关信息。比如看到冰岛北极光的照片,可以询问 Meta AI 一年中的什么时间最适合观看北极光。
本文来自微信公众号“硬AI”,关注更多AI前沿资讯请移步这里