最近,一项来自于Sakana AI的研究,在推理过程中——而不是在构建——试图将三种模型的能力整合起来。结果令人惊讶,整合后的模型能力都远超单个模型,三模合一的性能也好于只有两个模型合体的性能。
风险提示及免责条款
市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。
最近,一项来自于Sakana AI的研究,在推理过程中——而不是在构建——试图将三种模型的能力整合起来。结果令人惊讶,整合后的模型能力都远超单个模型,三模合一的性能也好于只有两个模型合体的性能。
Sakana AI使用一种新的推理时Scaling算法,自适应分支蒙特卡洛树搜索AB-MCTS(Adaptive Branching Monte Carlo Tree Search)。使用AB-MCTS将o4-mini、Gemini-2.5-Pro和R1-0528这三种当前最先进的AI模型组合起来,在ARC-AGI-2基准测试中取得了令人惊讶的成绩。多模型的得分远超单独的o4-mini、Gemini-2.5-Pro和DeepSeek-R1-0528模型。(新智元)