智源最新模型评测:百度文心大模型4.0登顶闭源榜 近日,由北京智源研究院打造的FlagEval天秤大模型评测平台实现了全面升级,并公布202406期FlagEval模型评测排行榜单。最新一期榜单显示,百度文心大模型4.0以89.72的综合评分在闭源对话模型中排名第一,超过字节云雀、豆包和阿里通义千问等一众国产大模型,以及OpenAI的最新模型GPT-4o。在中文语境下,以文心大模型为代表的国内头部语言模型的综合表现已超过国际一流水平的表现。