记者获悉,全球权威评测机构Artificial Analysis发布全新Coding Agent基准Artificial Analysis Coding Agent Index,用于衡量Agent harnesses与模型的组合在SWE-Bench-Pro-Hard-AA、Terminal-Benchv2和SWE-Atlas-QnA主流基准上的表现。其中,闭源模型Opus4.7(在CursorCLI中运行)全球第一,GLM-5.1(在ClaudeCode运行)取得开源第一。从评测结果上来看,GLM-5.1代表了国产大模型在实际编程Agent场景下的SOTA级别能力。(澎湃)
风险提示及免责条款
市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。