随着具身智能成为人工智能的下一个战略高地,底层算力底座的自主可控显得尤为关键。近日,摩尔线程联合北京智源人工智能研究院(以下简称:智源)基于FlagOS-Robo框架,依托MTT S5000千卡智算集群,成功完成智源自研具身大脑模型RoboBrain 2.5的全流程训练。
这是行业内首次验证国产算力集群在具身智能大模型训练中的可用性与高效性,标志着国产AI基础设施在应对复杂多模态任务上迈出了关键一步。通过面向多元芯片的统一AI系统软件栈FlagOS与MTT S5000硬件集群的高效协作,该解决方案不仅“能训”,而且实现了“训得稳、训得快”,为具身智能从实验室走向产业落地提供了坚实底座。
RoboBrain是智源面向真实物理场景打造的通用具身大脑,以统一的视觉—语言多模态架构,为机器人在感知、认知、推理与决策上的核心能力提供基础支撑。RoboBrain 2.5在原有通用具身大脑的基础上,新增了机器人对动作时序价值评估和三维空间结构的理解与推理能力,对下游任务执行成功率有显著提升。
FlagOS-Robo是基于开源开放的多芯片AI软件栈FlagOS构建的,面向具身智能的训练与推理一体化框架。它支持从端到云的多场景部署,兼容多种芯片,能够同时实现大脑模型(VLM)与小脑模型(VLA)的高效协同训练与推理。FlagOS-Robo打通从数据采集到真机与评测的全链路,覆盖数据加载、模型训练、推理到具身评测的全流程,有效降低了开发复杂度。它支持多芯片,有统一实验管理、多芯片自动调优等功能,实现一键跨本体部署。通过这一完整生态,FlagOS-Robo将为具身智能的前沿研究与产业应用提供强大的算力底座与系统化支撑,加速AI技术的创新与落地。

多维评测验证,指标全面对齐
为了检验模型算法效果,智源团队在 2D/3D空间感知推理榜单、时序价值评估榜单等多个权威具身评测数据集上进行了验证。结果显示,基于MTT S5000国产千卡训练出的RoboBrain-2.5模型,在多项关键指标上均与国际主流GPU训练模型保持一致。特别是在CrossPoint、Q-Spatial、VABench-V任务上,算法效果表现更优。这种全面对齐的评测结果,表明FlagOS-Robo框架与MTT S5000算力协同训练出的“具身大脑”,在理解、规划和执行能力上已达行业一流水准。
Loss完美对齐,误差小于0.62%
在模型精度方面,基于MTT S5000的夸娥智算集群表现出极高的稳定性。训练曲线显示,MTT S5000千卡集群上的Loss走势与国际主流GPU训练结果高度重合,相对误差小于0.62%。这一低误差表明国产算力训练准确性的同时,智源FlagOS-Robo框架成功实现了跨平台的无损迁移,开发者无需担心硬件更换导致的模型性能下降,真正做到了“代码不改、精度不降”的平滑适配。
极致线性扩展,千卡加速比超 90%
大规模集群训练的核心在于效率。本次训练实测数据显示,摩尔线程MTT S5000千卡智算集群展现了较高的扩展能力:从64卡扩展至1024卡,系统实现了90%以上的线性扩展效率。扩展曲线呈现出极佳的线性增长趋势,这意味着随着算力资源的增加,训练速度几乎同步倍增,充分证明了国产集群在大规模并行计算和通信调度上的成熟度,并具备支持万卡级训练的能力。
此次摩尔线程与智源研究院的深度合作,将进一步加速具身智能从实验室走向产业落地的进程,为行业提供可复制、可规模化的“国产算力训练范式”,为中国具身智能产业提供了一个自主、开放、高效的算力底座。
本文来源:摩尔线程





