作者 | 刘宝丹
编辑 | 黄昱
在苹果Vision Pro登陆中国市场53天后,字节旗下XR公司PICO终于拿出酝酿已久的新品。
8月20日,PICO在北京举办新品沟通会,正式推出旗下首款MR混合现实一体机PICO 4 Ultra。这是PICO时隔两年后的又一次新品发布,很多人将其看成是苹果头显的平替。
去年11月,PICO开启新一轮收缩,只保留了核心团队,市场销售服务、游戏、视频等团队均被大幅缩减。
这是一个重要转折,意味着此前高举高打的PICO转换了发展节奏,但也为日后的发展保留了火种。
可以说,PICO 4 Ultra是PICO回归产品研发战略后的第一款产品,很大程度上代表了其对XR未来发展的态度。
在新品沟通会上,PICO OS产品负责人马杰思表示,公司在XR领域的投入是持续且稳定的。“从长远来看,XR这个领域要到iPhone时刻,需要更多的耐心和长期投入。”
具体到产品上,PICO 4 Ultra搭载了全新高通骁龙®XR2 Gen 2计算平台,以及配备了双目3200万像素彩色透视摄像头和iToF深度感知摄像头,无论是性能还是视觉体现都显著提高。
系统层面,PICO 4 Ultra引入了全景屏工作台,用户可以在现实空间中同时打开和排布多个虚拟大屏,提升多任务处理的效率和舒适度。
很大程度上,PICO 4 Ultra的推出代表了PICO在MR技术领域的突破。
马杰思表示,之前没有做MR有客观原因,MR对算力和硬件、软件的要求是更高的。“有了现在技术条件的支持,我们可以开始做一些与现实世界结合的体验,它是自然发展到了现在的阶段。”
产品性能之外,一款MR产品是否受欢迎还取决于应用生态。截至2024年8月12日,PICO商店拥有的应用共754款,PICO 4 Ultra更是覆盖了影音娱乐、办公、生产力等多种场景。
这是一个很大的进步,相较于七八年前以VR游戏为主的应用生态,如今有更多通用场景开始登录MR设备。
PICO互联也得到升级,它支持与PC/Mac及手机之间无缝跨屏互联,方便用户在不同设备间切换,共享屏幕并远程操作。
此外,PICO还发布了动作捕捉配件PICO体感追踪器,用户只需将追踪器绑在脚踝处,即可实现全身动作捕捉。该设备还支持包括Tempo Club、莱美舞蹈等诸多全球娱乐应用。
不同于此前为开拓市场而采取的价格补贴策略,这次PICO在定价上更趋理性。
目前,PICO的新产品已全面开启预售,并将于9月2日正式开售。据悉,PICO 4 Ultra售价4299元,PICO体感追踪器售价399元一对。
马杰思表示,技术发展的阶段和路径决定了策略,也应该与现实相对应。我们的策略是追求能够长期持续投入的状态。
作为苹果Vision Pro平替,在前者并未在中国市场引发抢购热潮的背景下,PICO 4 Ultra能在MR市场掀起多大的浪花,市场将很快给出回答。
华尔街见闻与PICO OS产品负责人马杰思、PICO生态和应用商店负责人姚帅、PICO硬件产品经理(PICO 4 Ultra)胡熙坤等进行了对话,以下为交流会实录(经编辑):
问:公司目标是朝Apple Vision Pro的方向发展吗?如何看待Meta和苹果发布的MR设备?PICO接下来的方向是什么?
马杰思:回顾XR产业的发展,主要还是围绕沉浸式游戏展开的。随着传感器技术的进步和算力的提升,MR相关的应用逐渐开始实现。之前没有做MR不是有什么主观的因素,而是很客观的原因,MR对算力和硬件、软件的要求是更高的。走到这个阶段,MR与现实世界结合的能力更为突出,显然更应该与现实生活产生更多关联。
如今设备能实现的沉浸式体验,带你进入另一个世界的效果更突出。有了现在技术条件的支持,我们可以开始做一些与现实世界结合的体验,它是自然发展到了现在的阶段。
问:今年公司在推进AI战略,就PICO来说,用AI+眼镜是不是当前市场接受度比较高的形式?
马杰思:AI在我们的产品中有许多应用,远不止于大语言模型。我们提到的环境感知、实时建图、环境语义理解、空间锚点,背后都是计算机视觉相关技术。传感器感知环境、识别物体,都是与计算机视觉技术密切相关的应用。
我们不应该局限于大语言模型的方向,AI与XR从早期就有许多交集,包括唐贞提到的体感追踪器,其中涉及的算法训练等,都是AI相关的。
问:PICO之前在场景上更关注游戏和视频这两个方向,未来哪些场景是PICO将重点投入的?
马杰思:今天的发布会中我们也提到了全景屏工作台,希望大家在更通用的场景下使用XR设备。PICO全景屏工作台支持办公、同时使用抖音、B站、小红书等应用,甚至玩安卓手机游戏。我们希望它能向通用场景发展,类似于使用电脑的方向。
姚帅:运动和社交也是非常重要的场景。我们公布了体感追踪器,特意展示了用户在躺着时或锻炼时的动作,许多场景都是用户和开发者根据现实需求提出的。
社交方面,VR社交中大家希望动作更加逼真。我们做了一款价格非常优惠实在,能力非常靠谱的设备,在此方面的努力也是为了增强产品的通用性和用户体验。
问:第二个问题,这款产品与PICO以前的产品在定义上有哪些变化?以前更偏向垂直场景,如游戏,现在变得更加通用,这种转变是如何达成的?产品经历了多长时间的筹备?
马杰思:2015、2016年,大家也并不仅仅是想做VR游戏,而是把它作为计算平台来看待。只是当时的算力和传感器技术发展阶段最适合用来做VR游戏。现在,无论是算力、传感器还是软件,都允许我们做一些通用场景的应用,这种转变有一定的客观的因素存在。
问:字节跳动对PICO业务是否有新的要求?比如销量或产品方面?
姚帅:就像我们之前发言人对外回复的那样,字节跳动对PICO保持探索的耐心。这次合作一直在持续推进,整体上是非常顺利的。
问:PICO经历了之前的调整后,整体产品策略是否有变化?XR行业大家之前讲的iPhone时刻一直没有来,我们现在对整体市场趋势的判断是什么样的?
马杰思:公司在XR领域的投入是持续且稳定的。今天发布的众多技术和产品功能也体现了我们在这一领域的持续投入和决心。
从长远来看,XR这个领域要到iPhone时刻,需要更多的耐心和长期投入。与iPhone进行对比并不准确,XR更像是PC类产品,需要时间和投入。
问:此次发布的功能有很多升级,我们是否对PICO产品的轻便性有过相关考量?PICO4Ultra在轻便性上相比以前有何改善?
胡熙坤:重量上相比上一代减少了6克,从586克降至580克。此外,我们在设计上也做了一些优化。
问:大模型在手机和PC设备上已经有了落地应用,在XR领域,大模型的应用场景是怎样的?
马杰思:正如刚才提到的,AI在很多领域都有应用,XR领域也不例外。但目前大语言模型并不是我们主要关注的方向。我们在AI方面会有所探索,未来的规划暂时无法透露。
问:有报道说PICO在研发AI可穿戴设备,可能会搭载豆包大模型,能否透露一些信息?
马杰思:暂时不能透露相关信息。
胡熙坤:今天发布会上讲的Special ML可以关注一下,它比较好的展现了XR平台在搭载算法上面的一些优势。例如人脸替换等功能,这些能力比以往的设备更强。然而,XR行业还没有发展到可以立即看到大模型效果的阶段,这需要时间和进一步探索。
问:VR/XR头显在新的场景上加入了许多新生态内容。您认为PICO未来的发展方向是独立设备还是周身设备?
马杰思:未来肯定是周身设备。
问:PICO未来是会成为平台性的工具,还是好玩的玩具?
马杰思:从最开始大家做XR的时候,2014、2015、2016年就觉得它是计算平台,只是当时受到各方面的条件限制,主要是用来玩VR游戏。从来没有人只是把它当成是一个VR游戏机来做的,只是那个阶段最适合做这件事情。当客观的条件允许,算力、传感器各个条件允许,它可以走到下一个阶段,做一些更通用的场景。
问:随着环境重建算法、摄像头、芯片等功能的提升,PICO4Ultra这样的VR设备会全面取代纯VR设备吗?
马杰思:是的,你也能看到它能进行MR和VR的切换,一个MR产品一定能做VR的事情,但是VR产品,没有双目的RGB彩色透视摄像头,它就不能做MR的事情。MR可以做VR的事情,是有一定的包含关系在。比如它可以在主控室中进行MR/VR的切换。
问:刚才说到全景屏,看发布会的时候是周围绕了一圈,可以上下堆叠吗?
马杰思:也可以上下堆叠,可以堆的非常高。
问:这款产品能输出800万像素画面,环境重建的时候,能否更高?中间是什么考量?
胡熙坤:因为摄像头的工作原理,输出视频流的时候不能是所有的像素都输出。手机也是一样,拍照的像素数量比摄影的像素数量高视频输出时,我们为了确保画质,会将四个像素合并为一个像素,因此实际输出的视频像素较低。
问::我们看到这个产品的价格,能否谈谈定价背后的逻辑和思考?当前的定价是否反映了成本?哪些成本是我们重点投入的?
马杰思:PICO4Ultra在多个方面进行了升级,比如增加了传感器和3200万像素的彩色摄像头,因此成本较之前更高。我们现在的定价反映了XR是一个长期投入的技术方向,希望以一种长期可持续的方式进行投入。
问:刚才发布会提到PICO4Ultra最多支持20个屏幕,这是基于真实的用户需求,还是性能的上限?
马杰思:20个屏幕是性能的上限。在内测时,用户实际使用的平均是3-6个屏幕。20个只是上限。
问:用户会同时打开小红书、B站和抖音吗?
马杰思:在360度的圆柱体显示空间中,用户会倾向于打开更多的窗口,放在不互相遮挡的位置。这种使用方式是基于用户的本能。
我们在实际使用中也看到用户有类似的行为。一些用户会同时打开三个视频一起看。这个功能存在,也有用户尝试。大多数情况下,用户平均使用3-6个应用。
问:在设计产品时,如何看待PICO的语音交互?现在语音交互技术已经非常成熟,但在PICO上似乎没有看到加强。
马杰思:从宏观来看,多模态交互是一个方向。
与XR设备结合得比较好的交互方式主要是利用人体五官的各种输入输出能力,比如语言、眼睛、手等,这些对XR方向来说都非常重要。
目前我们在PICO4Ultra输入法中加入了语音识别能力,你可以点击语音识别进行输入,这在一定程度上缓解了XR设备上文字输入的难题。但XR文字输入仍然是一个痛点,真正解决还需要更长期的探索和研究。
问:有没有全场景的语音交互,适用于任何操作层面?
马杰思:语音肯定是多模态交互中的重要部分。
问:未来的产品规划是什么样的?
马杰思:很抱歉,未来的产品规划我们不能透露。正如刚才提到的,我们认为XR是需要长期持续投入的技术方向。
问:未来是否会明确不再像之前那样激进地采取价格战或补贴的策略?
马杰思:从长期可持续的角度来看,技术发展的阶段和路径决定了策略,也应该与现实相对应。我们的策略是追求能够长期持续投入的状态。