人工智能(AI)的影响从未像现在这样深入社会。斯坦福大学的人工智能研究机构(Stanford HAI)4月8日发布《2025年人工智能指数报告》认为,推理成本暴降280倍,小模型性能飙升,AI正变得更高效、更普惠。
报告还指出,中国高性能AI模型的数量和质量不断提升,对美国的领先地位构成挑战,顶级模型之间的性能差距正在缩小。
美国此前在模型质量方面的领先优势已经消失。中国是人工智能出版物和专利产出最多的国家,如今其开发的模型在性能上已经与美国的竞争对手不相上下。
“2023年,在大规模多任务语言理解测试(MMLU)中,中国领先的模型落后于美国顶级模型近20个百分点。然而,到2024年底,美国的领先优势缩小到了0.3个百分点。”
最新的斯坦福HAI博文中,浓缩了2025年AI指数报告的十二大亮点。
1. AI性能突飞猛进:新基准下的爆发式增长
2023年,研究人员推出了新的基准测试,如MMMU、GPQA和SWE-bench,以测试先进AI系统的极限。
仅一年后,性能便急剧提升:在MMMU、GPQA和SWE-bench上的得分分别提高了18.8、48.9和67.3个百分点。除了基准测试之外,AI系统在生成高质量视频方面也取得了重大进展,在某些情况下,语言模型代理甚至在编程任务中超越了人类,尽管时间预算有限。
2. AI渗透日常生活:从实验室走向现实
从医疗保健到交通运输,AI正迅速从实验室走向日常生活。
2023年,美国食品药品监督管理局(FDA)批准了223款AI医疗设备,而2015年仅有6款。
在道路上,自动驾驶汽车不再是实验:Waymo每周提供超过15万次自动驾驶服务,而百度的Apollo Go无人驾驶出租车队现已服务于中国多个城市。
3. 企业押注AI:投资与应用双双飙升
2024年,美国私营AI投资增长至1091亿美元,是英国45亿美元的24倍。
生成式AI表现尤为强劲,吸引了全球339亿美元的私人投资,比2023年增长了18.7%。AI业务的使用也在加速:78%的组织报告称在2024年使用了AI,高于前一年的55%。
越来越多的研究证实,AI提高了生产力,并且在大多数情况下,有助于缩小劳动力中的技能差距。
4. 美国仍领跑AI模型:但中国正在缩小差距
2024年,总部位于美国的机构产生了40个值得关注的AI模型,大大超过了欧洲的3个。
虽然美国在数量上保持领先,但中国模型在质量上迅速缩小差距:在MMLU和HumanEval等主要基准测试上的性能差距从2023年的两位数缩小到2024年的接近持平。
与此同时,中国在AI出版物和专利方面继续保持领先地位。同时,模型开发日益全球化,来自中东、拉丁美洲和东南亚等地区的项目也值得关注。
5. 负责任AI生态发展不均
与AI相关的事件正在急剧上升,但在主要的工业模型开发商中,标准化的RAI评估仍然很少见。
然而,如HELM Safety、AIR-Bench和FACTS等新基准测试为评估事实性和安全性提供了有希望的工具。在公司中,承认RAI风险与采取有意义的行动之间仍然存在差距。
相比之下,各国政府正表现出越来越大的紧迫性:2024年,全球在AI治理方面的合作加剧,包括OECD、欧盟、联合国和非洲联盟在内的组织发布了侧重于透明度、可信度和其他核心负责任AI原则的框架。
6. 全球AI乐观情绪上升:地区差异依然显著
在诸如中国(83%)、印度尼西亚(80%)和泰国(77%)等国家,大多数人认为AI产品和服务的益处大于危害。相比之下,在诸如加拿大(40%)、美国(39%)和荷兰(36%)等地方,乐观情绪仍然较低。
尽管如此,情绪正在发生变化:自2022年以来,在几个此前持怀疑态度的国家,乐观情绪显著增长,包括德国(+10%)、法国(+10%)、加拿大(+8%)、英国(+8%)和美国(+4%)。
7. AI变得更高效、更经济、更易于获取
在越来越强大的小型模型的推动下,执行GPT-3.5水平任务的系统推理成本在2022年11月至2024年10月期间下降了280多倍。
在硬件层面,成本每年下降30%,而能源效率每年提高40%。开源模型也在缩小与闭源模型的差距,在某些基准测试中,性能差距从8%缩小到1.7%。这些趋势正在迅速降低先进AI的门槛。
8. 政府加大对AI的投入:监管与投资并重
2024年,美国联邦机构引入了59项与AI相关的法规,是2023年的两倍多,并且由两倍多的机构发布。自2023年以来,全球75个国家提及AI的立法增加了21.3%,自2016年以来增长了九倍。
除了日益增长的关注之外,各国政府正在大规模投资:加拿大承诺投资24亿美元,法国承诺投资1090亿欧元,印度承诺投资12.5亿美元,沙特阿拉伯的“超越”项目代表着一项1000亿美元的计划。
9. AI与计算机科学教育扩张:机会与挑战并存
目前,三分之二的国家提供或计划提供K-12计算机科学教育,是2019年的两倍,其中非洲和拉丁美洲取得了最大的进展。
在美国,拥有计算机科学学士学位的毕业生人数在过去10年中增加了22%。然而,由于电力等基本基础设施的差距,许多非洲国家仍然难以获得教育。在美国,81%的K-12计算机科学教师认为AI应该成为基础计算机科学教育的一部分,但只有不到一半的人认为自己有能力教授它。
10. 行业在AI领域加速发展:前沿竞争日益激烈
2024年,近90%的著名AI模型来自行业,高于2023年的60%,而学术界仍然是高度引用的研究的主要来源。模型规模持续快速增长,训练计算量每五个月翻一番,数据集每八个月翻一番,功耗每年增加。
然而,性能差距正在缩小:排名第一和第十的模型之间的分数差距在一年内从11.9%下降到5.4%,并且前两名之间的差距仅为0.7%。前沿领域竞争日益激烈,也变得拥挤。
11. AI在科学领域的影响力获得认可:荣获顶级荣誉
AI日益增长的重要性反映在主要的科学奖项中:两个诺贝尔奖表彰了导致深度学习(物理学)和其在蛋白质折叠(化学)中的应用的工作,而图灵奖则表彰了对强化学习的开创性贡献。
12. 复杂推理仍然是一个挑战:局限性依旧存在
AI模型擅长解决国际数学奥林匹克问题等任务,但在PlanBench等复杂推理基准测试中仍然面临挑战。它们经常无法可靠地解决逻辑任务,即使存在可证明正确的解决方案,这限制了它们在高风险环境中的有效性,在这种环境中,精确性至关重要。