7*24 快讯

李飞飞团队“50美元”复刻DeepSeek的R1?阿里云:基于Qwen2.5-32B-Instruct模型训练

今日有报道称李飞飞等斯坦福大学和华盛顿大学研究人员以不到50美元的云计算费用训练了一个名叫s1的人工智能推理模型,该模型在数学和编码能力测试中的表现与OpenAl的o1和Depsek的R1等尖端推理模型类似,引发广泛关注。

不过很快,该s1模型被指“并非从零开始训练”,其基座模型为“阿里通义千问(Qwen)模型”。