刚刚,新模型 Qwen3-Max-Preview (Instruct)上线了!这是我们迄今为止最大的模型,参数量超 1 万亿!
Qwen3-Max-Preview 在多项主流权威基准测试中展现出全球领先的性能。在通用知识(SuperGPQA)、数学推理(AIME25)、编程(LiveCodeBench v6)、人类偏好对齐(Arena-Hard v2)以及综合性能力评估(LiveBench)评测中,Qwen3-Max-Preview 超越了Claude-Opus 4(Non-Thinking),以及Kimi-K2、DeepSeek-V3.1和我们此前的开源最佳Qwen3-235B-A22B-Instruct-2507。
在我们的内部测试和早期用户测评中,Qwen3-Max-Preview 的确表现出更强的智能水平,更广的知识面,更优秀的对话能力,在Agent任务与指令遵循等方面拥有更强劲的性能。
这证明了,规模化扩展(Scaling)仍然有效,更大的模型拥有更强的性能。
目前,Qwen3-Max-Preview已正式上线阿里云百炼平台,可通过API直接调用。同时,Qwen Chat 也同步上线新模型,支持免费使用。
欢迎大家体验我们的新模型,也敬请期待正式版Qwen3-Max的发布!
来源:通义千问Qwen,原文标题:《上新!超万亿参数的Qwen3-Max-Preview来了》
风险提示及免责条款
市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。