Mistral推出Mistral Large 2：对标Llama 3.1 405B

AI寒武纪

2024/07/26 07:50

Mistral Large 2拥有1230亿参数。在多个基准测试中（特别是在代码生成和数学领域），表现优异，甚至与Llama 3.1 4050亿参数相媲美。像Mistral NeMo一样，它经过大量源代码和多语言数据的训练，提供高级函数调用功能。

今天，Mistral AI推出了Mistral Large 2。Mistral Large 2拥有1230亿参数。在多个基准测试中（特别是在代码生成和数学领域），表现优异，甚至与Llama 3.1 4050亿参数相媲美。像Mistral NeMo一样，它经过大量源代码和多语言数据的训练，提供高级函数调用功能。

试用：chat.mistral.ai

主要特征

多语言设计：支持数十种语言，包括英语、法语、德语、西班牙语、意大利语、中文、日语、韩语、葡萄牙语、荷兰语和波兰语

精通编程：接受过Python、Java、C、C++、Javacsript、Bash等80多种编码语言的训练。还接受了一些更特定的语言（例如 Swift 和 Fortran）的训练

以代理为中心：一流的代理功能，具有本地函数调用和 JSON 输出功能

高级推理：最先进的数学和推理能力

研究许可：允许用于研究和非商业用途的使用和修改

大上下文：128k 大上下文窗口

在HumanEval和MultiPL-E测试中，Mistral Large 2的表现超过了Llama 3.1 4050亿指令，仅略逊于GPT-4o。在MATH测试中（零样本，无CoT条件下），它稍逊于GPT-4o。

在多语言MMLU测试中，Mistral Large 2的性能显著优于Llama 3.1 70亿基础版（平均提升了6.3%），与Llama 3 4050亿参数的性能相当（仅低于0.4%）。

与之前的Mistral Large相比，在模型对齐和指令遵循能力上投入了更多精力，新的 Mistral Large 2 在遵循精确指令和处理长时间的多轮对话方面尤其出色，在WildBench、ArenaHard和MT Bench测试中，它的性能与最佳模型相当，同时显著减少了冗余输出。

本文来源：AI寒武纪，原文标题：《【模型大战】Mistral 推出了Mistral Large 2：对标Llama 3.1 405B》

风险提示及免责条款

市场有风险，投资需谨慎。本文不构成个人投资建议，也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资，责任自负。