作者 | 周智宇
国内具身智能赛道迎来2026年首笔重磅融资,更罕见地促成了互联网三大巨头的资本“会师”。
1月12日,自变量机器人(X Square Robot)正式宣布完成10亿元人民币A++轮融资。本轮融资由字节跳动与红杉中国联合领投,跟投方阵容豪华,包括北京信息产业发展基金、深创投、南山战新投、锡创投等国资机构。
值得注意的是,这是深创投AI基金自成立以来投出的第一笔资金。至此,成立仅两年多的自变量机器人,已成为国内极少数同时获得阿里、美团、字节跳动三家互联网巨头战略投资的具身智能公司。
在过去的一年中,互联网大厂在具身智能领域的布局往往各有侧重,鲜少在同一标的上达成共识。自变量机器人的融资历程却打破了这一惯例:
2025年5月,获美团战略投资(A轮);
2025年9月,获阿里云领投(A+轮);
2026年1月,获字节跳动领投(A++轮)。
三家巨头能一齐看中自变量,是因为自变量切中了各家业务的“最大公约数”:通用的物理世界模型。美团关注末端配送的复杂操作,阿里聚焦仓储物流的自动化闭环,而字节跳动则意在将多模态算法优势延伸至物理终端。自变量展现出的泛化能力,使其成为各方都不愿错过的战略支点。
与行业主流的“先造本体,再配大脑”不同,自变量机器人始终坚持“模型定义硬件”。创始人兼CEO王潜认为,具身智能的下一阶段竞争,本质上是“数据闭环构建的基础模型与模型进化能力的竞争”。
在近期,王潜明确表示:“具身智能模型是物理世界的基础模型,独立于、平行于语言模型。我们不应只是把大模型装进机器人,而是要为了大模型去重新设计机器人的身体。”
基于这一理念,自变量并未像友商那样盲目追求机器人的运动爆发力,而是专注于解决非结构化环境下的精细操作难题。其自主研发的Wall-OSS操作系统,被视为具身智能领域的“Android”雏形,意在通过开源基座通过软件能力抹平硬件差异。
此外,自变量自研了WALL-A模型,这是首创的VLA(视觉-语言-动作)与世界模型深度融合的系统范式。该模型率先实现了“具身多模态思维链”,能利用世界模型进行时空状态预测,并从数据中内化物理常识。
这种技术架构让机器人拥有了惊人的泛化能力:在最新的外卖配送与纸箱回收测试中,即便面对强风干扰或视线遮挡,机器人也能像人类一样“脑补”全貌并自主纠错,无需人工干预。此外,模型进化还解锁了高难度的精细操作,机器人已能自主完成手内重定向、发牌等对指尖力控要求极高的动作。
为了支撑“大脑”的进化,自变量在数据和硬件上也构建了严密的闭环。
在数据端,公司最早规模化扩展了真机数据采集,通过主从遥操、外骨骼等设备,搭建了模型驱动的数据管线。
在硬件端,自变量发布了“量子一号”和“量子二号”两款高性能机器人本体。通过对机械臂、关节模组等核心零部件的全面自研与算法适配,公司大幅降低了整机成本。
目前,自变量的机器人已逐步进入工业制造、物流、养老等多个高价值领域。面对堆叠混乱的物流包裹,机器人凭借零样本泛化能力,已能精准识别异形件并快速适应工作节拍。
据官方披露,本轮融得的10亿元资金将主要用于其下一代统一具身智能通用大模型的训练与迭代。
随着2026年被行业普遍视为具身智能的“落地元年”,这场关于物理世界入口的争夺战已进入深水区。自变量机器人集齐三巨头的资本与场景加持,无疑让这一赛道又多了个种子选手。





