本文作者:蒋紫涵
来源:硬AI
近日,特斯拉Optimus的现场演示以及宇树Unitree H1的春晚首秀,都展示了人形机器人的进步,但整体技术仍未达到工业或消费领域大规模应用的要求,主要受限于通用和自主AI能力不足。
2月20日,高盛分析师Jacqueline Du、Yuichiro Isayama等人发布研报称,人形机器人技术的拐点可能会出现在三个方面:解决多个通用任务、高成功率和持续稳健性、快速推理。
高盛还指出,近年来,人形机器人制造商数量快速增长,这一行业可能已经接近进入量产阶段,此外,英伟达推出的物理AI研发生态系统也是推动人形机器人技术发展的另一个关键因素。
在2024年3月的GTC大会上,英伟达推出了边缘计算SoC Jetson Thor、GR00T模型,以及Isaac平台。Jetson Thor是人形机器人所需的高性能硬件,能够让机器人自主运行预训练的边缘AI模型;Isaac是一个集成了多种工具的研发平台,生成了英伟达内部的通用模型GR00T。
但是,高盛也指出,目前人形机器人的发展仍然存在一些障碍,比如缺乏训练所需的原始数据。
与大语言模型(LLMs)类似,机器人AI模型也需要大量数据来支持模型训练和优化;但与LLMs的视频、图像、文本数据不同,机器人AI模型所需的重要物理数据(如力、扭矩、运动数据)仍然稀缺。
因此,弥补原始物理数据的短缺已成为促进机器人AI研发的共识需求,鉴于这一需求,多家企业纷纷做出响应。例如,英伟达推出的Isaac GR00T Blueprint和Cosmos框架能够利用合成数据加速模型训练,弥补这一不足。
拐点一:解决多个通用任务
通用性是人形机器人与传统工业机器人之间的关键区别:传统工业机器人通常被设计用于完成特定任务,如装配线上的单一操作;相比之下,人形机器人需要具备处理多种任务的能力,比如在家庭、办公室或工业环境中执行不同的工作。
因此,高盛认为人形机器人至少需要在多个(例如5到10个)通用任务上表现出色,才能开始大规模应用。
这里的通用任务包括但不限于搬运物品、清扫、提供服务(如引导、语音识别)、数据采集、以及与人类的互动等。这种通用性是人形机器人实现大规模应用的关键,因为它能使机器人适应更加多样化的工作环境和需求,而不仅仅局限于特定领域。
拐点二:高成功率和持续稳健性
高成功率指的是机器人在执行任务时能够成功完成目标动作或任务的频率。
持续稳健性则是指机器人能够在长时间内保持稳定运行,尤其是在需要长时间工作或高负荷任务的场合。商业化的机器人需要能够承受长时间工作,且不易出现硬件损坏或软件崩溃。
高盛表示,人形机器人在长时间操作中的高成功率和稳健性,能够确保其稳定输出,这对商业化至关重要。
拐点三:快速推理
快速推理是指人形机器人能够快速处理输入信息并作出决策的能力,人形机器人高效的推理和反应能力可以大大提高效率和客户互动体验。
在实际应用中,人形机器人常常需要实时处理来自环境、传感器和用户的各种信息,并在极短的时间内作出响应。比如,机器人在与用户互动时,需要快速理解用户的语音命令,或在复杂环境中,及时调整动作以避免碰撞。
此外,快速推理还可以在机器人执行任务时减少延迟,使得机器人能够实时适应环境变化,提升效率。
从研发到量产
高盛表示,近年来,越来越多的企业进入了人形机器人领域,特别是在中国。
2024年,中国有15家公司进入人形机器人行业,并推出了17个新的机器人原型,而2023年仅为10个。华为、比亚迪、宁德时代等科技、汽车、新能源行业的领先企业也纷纷宣布启动人形机器人研发项目。
更重要的是,与2023年相比,人形机器人技术的领先者(如Figure、Agility、Unitree、AGIBOT、Leju等)在2024年已经开始了工厂测试或初步商业化。
这些进展表明,人形机器人行业可能已经接近进入量产阶段。
此外,对于中国人形机器人厂商而言,DeepSeek-R1的发布为赶超海外同行铺平了道路。
在DeepSeek推出之前,中国厂商必须基于OpenAI、Llama训练模型,而DeepSeek发布的高质量开源LLM,使用较低端的GPU和较低的成本,可能有助于国内厂商在竞争中获得优势。
系列文章:
高盛机器人深度研究(二):美国产业链以AI技术见长,中国靠零部件制造崛起
本文来自微信公众号“硬AI”,关注更多AI前沿资讯请移步这里