7*24 快讯

复旦测评13家大模型高考数学成绩,字节豆包II卷超GPT-4o夺冠

近日,复旦大学自然语言处理(NLP)实验室LLMEVAL团队公布了2024 年高考数学大模型评测结果。数据显示,字节豆包在2024高考数学新 II 卷客观题正确率达到74.66%,在13家大模型中排名首位。此外,在高考数学新 I 卷评测排名中,字节豆包也排在前列。

据悉,LLMEval是由复旦大学NLP实验室推出的大模型评测基准,专注于评估专业领域的知识能力。评测团队表示,全新出炉的高考试题具备高度的独创性和保密性,是用来评测大模型的“绝好评测集合”。因此,团队在高考后第一时间对GPT-4o、文心一言、阿里千问、字节豆包等13家大模型进行了评测。(全天候科技)