短短几分钟，AI轻松通过了CFA三级考试

2025/09/25 11:28

最新研究显示，多个AI模型已能在几分钟内通过享有盛誉的CFA三级考试，而人类通常需要数年学习。其中Gemini 2.5 Pro综合表现最佳，国产KIMI K2在多选题正确率达78.3%。尽管AI考试表现出色，但专家认为在情境理解等方面仍难以完全替代人类金融专业人士。

最新研究显示，多个AI模型已能在几分钟内通过享有盛誉的CFA三级考试，而人类通常需要数年时间和约1000小时学习才能完成。

纽约大学斯特恩商学院和AI财富管理平台GoodFin的研究人员测试了23个大型语言模型，发现包括o4-mini、Gemini 2.5 Pro和Claude Opus在内的前沿推理模型能够成功通过CFA三级模拟考试。

这些模型采用"思维链提示"技术，有效应对了此前令AI头疼的论文题型。GoodFin创始人兼首席执行官Anna Joo Fee表示：

我认为这项技术绝对有未来改变整个行业的可能。

AI模型全面突破CFA三级考试壁垒

两年前的研究曾发现，AI模型能够通过CFA一级和二级考试，但在三级考试的论述题环节遭遇重大障碍。

最新研究证实，AI技术的快速发展已经克服了这一关键瓶颈。

研究团队对23个大型语言模型进行了全面测试，特别关注AI模型是否具备"专业金融决策所需的专业化、高风险分析推理能力"，以此评估其在CFA三级模拟考试中处理选择题和论文题的能力。

研究结果表明，在处理复杂金融问题时，推理模型的表现显著优于传统的非推理模型。特别是采用"思维链提示"技术的前沿推理模型成功通过了相关考试测试。

其中Gemini 2.5 Pro在论述题评分中获得3.44分的最高成绩，同时在综合表现（选择题和论述题）中以2.1分位居榜首。

值得注意的是，国产的KIMI K2模型在多选题中表现最佳，正确率高达78.3%，超过谷歌的Gemini 2.5 Pro和GPT-5。

研究采用了零样本、自我一致性和自我发现三种提示策略，其中自我一致性策略取得73.4%的最佳表现评分。

在成本效益分析中，Llama 3.1 8B Instant获得5468的最佳成本效率评分，而Palmyra Fin以0.3秒的平均响应时间成为速度最快的模型。

尽管AI在标准化考试中表现出色，但业内专家认为完全替代人类金融专业人士仍存在局限。Fee强调：

诸如情境理解和意图判断等方面，机器目前还难以准确评估。这正是人类的优势所在，能够理解客户的肢体语言和各种暗示。

风险提示及免责条款

市场有风险，投资需谨慎。本文不构成个人投资建议，也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资，责任自负。