作者 | 黄昱、王小娟
编辑 | 周智宇
科技巨头们都在瞄准AI时代的超级入口——AI Agent火力全开,当前这一战场上不仅聚集了像腾讯、阿里、字节这样的互联网大厂,也有华为、荣耀、OPPO、vivo等手机厂商,更有一大批AI厂商和硬件厂商。
在移动互联网生态中,APP开发者一般会被视为数据控制者。而随着AI时代的到来,系统级AI能力被视为下一代设备的灵魂和核心壁垒,终端厂商将通过布局端侧AI掌握全局信息,其数据控制者的角色也将是确定的。
在终端设备上缺乏权限的AI Agent(智能体)很难真正自主干活。要想能重塑未来的软件生态,AI Agent厂商与手机终端设备厂商合作,从系统层面掌握全局信息,成为一大突破口。
在此背景下,12月1日,字节发布豆包手机助手技术预览版,这款与手机厂商在操作系统层面合作的AI助手软件已经搭载在中兴通讯的工程样机上。并且字节方面还表示,还在与多家手机厂商谈合作。
AI Agent将给各行各业带来前所未有的变革,同时也将改写整个硬件及软件行业地位商业生态。然而,面对诸多利益,各方力量必然将展开一场激烈的博弈。
豆包添了一把火
就在豆包手机助手发布前夕,市场关于字节跳动将自研AI手机的传闻不绝于耳。此前有产业链消息称,字节跳动正与老牌通信厂商中兴通讯联手打造AI手机,预计将于12月初正式发布。
然而,字节跳动最终选择了截然不同的路径。
豆包明确表示“没有自研手机计划”,而是聚焦于与手机厂商的合作。这种合作模式类似于谷歌Gemini与三星的合作关系,豆包提供AI能力,手机厂商提供硬件载体。
中兴通讯执行副总裁、首席运营官谢峻石曾在今年4月底表示:“AI很有可能给端侧带来整个的升级。”这一表态为双方合作埋下了伏笔。
根据官方演示,豆包手机助手深度集成到手机操作系统中,用户可通过语音、侧边键或豆包Ola Friend耳机直接唤醒豆包。它能够读取屏幕内容,跨应用调用服务,甚至完成全平台比价下单等复杂任务。
在豆包助手与中兴的合作背后,是2025年AI技术全面融入实体经济的关键转折点。
行业竞争已从单一技术参数比拼,升级为大模型、APP、硬件终端三大入口的生态化布局。三者相互渗透,形成“技术-场景-硬件”的闭环体系。
大模型作为底层技术核心,正通过两种路径产业化:一是通用大模型的平台化扩张,二是垂直领域大模型的深度定制。
在通用大模型方面,国内代表性的有字节的豆包大模型、阿里云的通义大模型、腾讯混元大模型等。在垂直大模型领域,各代表公司也已通过与自家业务结合,发布面向自身行业的大模型产品。
另一个代表性入口表示应用APP。APP作为用户直接触点,正从被动工具演变为具备自主决策能力的“智能体”(Agent),成为大模型落地的重要载体。
去年以来,豆包就成为不少用户手机上最常使用的AI类APP;今年开年之后,DeepSeek横空出世,进而进入更多人的手机。据市场研究机构QuestMobile数据显示,截至2025年9月,我国AI应用移动端月活跃用户规模已突破7.29亿大关,PC端为2亿。
最近,阿里发力C端,千问APP在公测一周之后,下载量便超过1000万,更是将APP这一AI入口推向高潮。
而作为各大互联网公司重金押注的领域,AI入口的每一个方向,各家都有所布局。
在技术和应用场景之外,直接嵌入硬件,打造AI终端,便是各玩家的最新考量方向。如今,豆包手机助手嵌入手机操作系统,便是AI以终端为入口的方向。
除了AI手机,AIPC也是这两年行业推出的产品主打的口号,过去一年,不少玩家已经推出相关的概念产品。
此外,几天之前,夸克发布了AI眼镜,为行业正在酝酿的百镜大战添上新的注脚。而AI眼镜能如此备受关注,是因为其也被认为是AI终端当中,能改变用户交互方式的产品之一。
面向更长远的未来,人形机器人、Robotaxi等终端,也被认为是重要的AI终端。
从技术到应用,再到AI终端,当前AI已经走到落地赚钱的关键阶段。
科技巨头们也明白,技术之争是重要的,但终究还是要手握更多AI入口,吸引大量用户,并且将入口优势转化为可持续的生态优势,才是长期竞争的关键。
各方激烈博弈
这场AI超级入口之争,目前已经席卷了AI厂商、硬件厂商、传统APP开发者等多方势力。
没有人敢置身事外,因为这不仅是对下一代超级流量入口的争夺,也是对AI时代话语权的争夺。
AI大模型在给终端设备带来前所未有的变革的同时,也在改变过去移动互联网生态中,APP开发者作为数据控制者的角色定位,以及改写APP的商业生态。
在AI Agent为“指挥官”的生态下,终端设备厂商或者是AI Agent的实际掌控者无疑将拥有最大的APP推荐权。
前不久特斯拉CEO马斯克还预测了一个激进的未来:未来5-6年,传统手机与App将消失,人类所消费的大多数内容都将由AI生成。
然而当前来看,一款真正好的终端AI Agent,除了更自主感知外,还需要打通第三方APP、打破单个APP的数据割裂,构建起接入第三方APP的AI生态。
为了达成这一目标,市场上现有两条技术分支:一是意图框架,需要第三方App授权,但技术相对成熟,硬件算力要求低;二是,纯视觉方案,无需授权,但技术仍有待提升,硬件算力要求更高。
然而,这两条路线目前来看都不太容易做好。第一条技术路线的阻碍显而易见,那就是在利益冲突、数据安全等问题下,第三方APP并不一定愿意向AI Agent开放授权。而纯视觉方案则面临着法律与合规的复杂挑战。
有开发者告诉华尔街见闻,纯视觉方案可以简单理解为读屏和模拟用户点击的方案,而国产安卓厂商读屏方案主要有两条技术路径:一条是通过录屏的形式读取屏幕信息;另一条是API Hook(API钩子)形式,这二者都需要获取无障碍等系统级权限。
无障碍权限原本是安卓系统给残障人士设置的特殊端口,可以帮助用户实现朗读屏幕、语音控制点击等。
以往,当用户买到一部手机,无论苹果IOS还是安卓系统都内置了“App沙箱隔离机制” ,阻止各个App相互读取数据;以及 “权限控制框架” 约束手机厂商也不能在未经用户同意的情况下获取敏感信息。
随着AI Agent时代的到来, 现有法律框架面临严峻挑战,难以直接套用,一套全新的规范亟待建立。
今年被视作AI Agent元年,一切都才刚刚开始,相关商业合作模式和数据隐私保护的责任边界都仍在探索阶段。
面对这一时代洪流,所有人都无法置身事外,必须共同努力在技术创新与防范风险之间找到新的平衡点。




