特斯拉在推特(X)平台上展示了Optimus机器人的最新进展,视频展示了视觉自标定、颜色分拣任务、单脚保持平衡等能力。从技术角度上看,特斯拉展示了机器人End-to-end技术路线可能性,依靠视觉自标定产生真实世界的数据,通过Dojo训练end-to-end网络,由图像直接生成机器人的控制指令并执行,并实现了颜色分拣任务。我们认为,该方案与其FSD的运行模式类似,FSD以及Dojo的成功经验有望加速机器人迭代速度,由单一任务向多任务拓展。建议关注特斯拉机器人相关受益标的以及特斯拉引领下机器人end-to-end网络和机器人姿态控制相关有望受益的公司。
事项
2023年9月24日,特斯拉在推特(X)平台上展示了Optimus机器人的最新进展,视频主要分为三个部分,四肢的视觉自标定、按颜色分拣任务和单脚保持平衡,对此我们点评如下:
机器人中的视觉自标定(self-calibrating)对标自动驾驶中的自动标注(auto labeling),为机器人训练提供真实世界数据集。
在视频的第一个部分,展示了机器人的视觉自标定能力,仅通过视觉和关节编码器,可以精确的定位四肢在空间中所在的位置。对于机器人训练而言,经标注过的真实世界训练数据集往往难以获得,需要大量人工手工标记,并且从二维图像到三维空间中映射的位置难以保证精度。特斯拉通过视觉自标定算法,通过视觉图像以及关节角度,可以自动生成精确的三维空间的位置数据,产生训练数据集。视觉自标定可类比特斯拉FSD中的自动标注,大幅提升了数据集标注的效率,为后续网络训练奠定基础。
展示机器人End-to-end技术路线可能性,纯视觉+端计算,未来有望复制自动驾驶(FSD)的成功路径。
过去来看,相比于新能源汽车,机器人具备更高的自由度、更复杂的动力学模型,机器人的端到端网络非常难训练。视频的第二个部分,展示了机器人在端到端网络下的颜色分拣能力,展示了该技术路线的可能性。此外,特斯拉提到:1)纯视觉:机器人采用纯视觉方案作为感知,神经网络的输入只有图像;2)端计算:特斯拉机器人的神经网络运行是完全本地的(fully on-board),无需采用云计算,并且在人的干扰下仍可以实时重新决策和执行;3)end-to-end:特斯拉机器人采用end-to-end,视频作为输入,控制作为输出(video in, controls out)。从纯视觉+端计算+end-to-end网络这几方面来看,特斯拉机器人与其FSD的逻辑架构十分接近,在Dojo的训练平台加持下,机器人未来有望复制FSD的成功路径。
单脚保持平衡,炫技机器人运动控制能力。
视频第三个部分,机器人展示了单脚保持平衡等若干“瑜伽”动作。单脚保持平衡相比于双脚保持平衡的难度进一步提升,对机器人的位控环和力控环要求进一步提升。具体而言,机器人中IMU传感器、关节力/力矩传感器以及制动器在单脚平衡任务中发挥重要作用。IMU通过监测机器人的整体姿势和倾斜角度,从而为人形机器人的位控环提供了重要反馈信息;力/力矩传感器作为力控环的感知设备,在机器人保持平衡中提供实时力反馈支持;制动器在机器人展示拉伸、瑜伽姿势时最后形成动作定格的过程中,确保机器人的精度和稳定性。特斯拉机器人已能实现单脚保持平衡,展现了强大的运动控制能力,强调了核心零部件的重要性。
特斯拉有望引领行业技术路线,相关产业链值得关注。
除了特斯拉本身的进展展示之外,特斯拉对于行业技术路线的引领是值得关注的。类似于特斯拉引领下,自动驾驶的技术路线有向不借助高精地图、不依靠激光雷达的纯视觉方案发展的趋势。我们认为,在特斯拉的引领下,机器人中纯视觉+end-to-end网络+端计算架构的应用,有望受到行业内其他同行关注,成为未来机器人的重要技术路径之一。
风险因素
机器人技术路线变动风险;机器人技术进步速度低于预期;机器人应用场景发展潜力低于预期。
投资策略
特斯拉人形机器人最新进展视频,展示了end-to-end网络在机器人中闭环的可能性。我们认为机器人end-to-end网络在实现单一任务后,迁移到其他任务的速度是很快的,后续迭代速度有望加速,复制FSD的成功路径。建议主要关注三条投资主线:1)特斯拉迭代速度加快,特斯拉人形机器人相关受益公司;2)机器人End-to-end网络下有望受益的公司;3)机器人运动控制。
本文作者:袁健聪等,来源:中信证券研究(ID:gh_fe1d2be7e8db),原文标题:《机器人|特斯拉end-to-end方案初现,有望复制FSD成功路径》
袁健聪执业编号:S1010517080005