扎克伯格谈AR/VR未来十年路线图

极客公园
扎克伯格表示,未来十年AR将让电影、游戏不被限制在长方形的屏幕里,VR将实现办公、社交等需求。

去年底,美国杂志《新共和》把脸书创始人马克·扎克伯格评选为「年度恶人」,杂志编辑在评语里写道:「扎克伯格在一场冗长且令人生厌的演讲中提出元宇宙的概念,完全不顾人们在非虚拟生活中真正想要做什么,更不用说在虚拟生活中了。」

众所周知,欧美人讨厌马克·扎克伯格。讨厌他那机器人一样的外形,讨厌他年纪轻轻就是亿万富豪,讨厌脸书对媒体的控制,讨厌 Meta 一年烧掉上百亿美元追求虚无缥缈的元宇宙——甚至就连因此受益的 VR 用户和从业者,对扎克伯格的印象也算不上太好。

在信奉技术的极客眼中,扎克伯格就是一个充满铜臭味的投机商人,尤其当他在 2019 年选择走轻量化路线,做 VR 一体机、元宇宙,并与卡马克为代表的 Oculus 技术派产生分歧时,这种质疑也达到顶峰。这也是为什么前段时间扎克伯格发一张简陋的元宇宙自拍,会在欧美引发山呼海啸般的嘲讽。

你可以质疑 Meta 的元宇宙能否成功,但对一年花 100 亿美元「学费」的扎克伯格,不能否认的是,今天他依然站在这个行业的最高处,拥有俯瞰 VR/AR 和元宇宙最清晰的视野。

或许是为了挽回自己「手滑」,或许是为即将发布的 Quest 2 Pro 暖场,近日扎克伯格做客全美最火的播客栏目《罗根体验秀》,与 UFC 大嘴评论员乔·罗根进行了一场两个多小时的对话。

在这期播客节目里,扎克伯格对新 Quest、VR/AR 未来的技术路线、元宇宙、神经接口、VR 社交和 VR 办公等行业的关键问题,详谈了自己了解的现状和看法。与发布会等公关场合上打官腔不同,这场与罗根的对话,扎克伯格讲出了不少干货。

以下为乔·罗根对话扎克伯格部分内容节选,由极客公园编译整理。

01「我们在做的是一步增加在场感」

乔·罗根:你的新 Oculus 很棒,令人印象深刻。

扎克伯格:是的,10 月份发布。我们将在即将到来的 Connect Conference 上讨论它,我对此非常兴奋。

乔·罗根:戴上它的时候非常有趣,我面前有一个化身,那是一个女异形(alien woman)。当我移动我的嘴时,女异形移动她的嘴。当我左右移动我的眼睛时,她跟着我的眼睛移动。当我做一张愤怒的脸时,她也作愤怒状...... 太不可思议了。你可以看到模仿过程,它以一种令人毛骨悚然的方式直接模仿人类,但这很酷。

扎克伯格:对我来说,这些东西都是在帮助人们建立连接。只是我开始思考,人们使用技术来感受彼此存在的最终表达是什么?当它不是手机,也不是电脑时。

比如你如何获得这种真实存在的知觉,就像你和另一个人待在一起一样,对我来说这是虚拟现实,乃至最终增强现实要实现的目标。你只需要在接下来的十年里运行技术路线图,一步步解锁它。而对于 10 月份即将推出的下一款设备,有一些重大的功能,像你所说的,本质上是关于社交存在(social present)。

新版虚拟现实中有某种眼神交流的能力,让你的脸被跟踪,这样你的化身就不仅仅是静止的东西。如果你微笑,如果你皱眉,或者你撅着嘴,不管你的表情是什么,实际上都可以实时转化给你的化身。就像人们待在一起那样,身体语言比口头交流更多。

乔·罗根:关于面部追踪你说得很对。打个比方,如果你用FaceTime 通话,你是看不到对方的眼睛的。如果你看着手机的镜头,那么你只是在向上看;而如果向下看屏幕上的人脸,你并没有和对方进行眼神交流。但是如果有了 VR 的化身,就能够重现真正的眼神交流。

扎克伯格:是的,这将是第一次真正意义上这么做。今天,通过技术我们可以打语音电话和视频电话,这很棒。因为如果你现在不能和某个人待在一起,能够看到他们的脸是件好事。但是当你在视频通话时,你不会觉得你真的和对方待在一起,即便你有信号可以获得信息,可以看到他们的脸。

在整个过程中,你都在试图说服你的大脑,你真的和他们在一起,但你的大脑知道:在更深的维度上,你实际上并没有和对方待在一起,你只是得到了一些诸如他们是谁、长什么样子的信息。

我认为,虚拟现实本质上解决的是:虽然你不在场,但让大脑相信「它」真的待在那里。要做到这件事需要解决很多意识层面的问题,每次我们做出一个新的版本,我们只是试着打破一个又一个的障碍。

很明显第一个障碍,就是要有一个头显,可以环顾四周。为此需要做到什么?你的眼睛基本上每五毫秒刷新一次。所以如果你转过头,而图像没有在五毫秒内刷新到你看的地方,那么你的视觉系统和你的前庭系统以及耳朵里的平衡感之间就会产生巨大的不匹配,人们随之感到身体不适。

然后我们有了手,这个事情很有趣。一开始我们想展示整个手臂,因为仅仅看到你的手有点奇怪。但事实上,你的大脑完全愿意接受看到你的手而没有长长的手臂,因为是你的手去试图操纵东西。另外,如果我们的插帧技术使得手臂位置翻转错位,你会感觉:啊,我的手肘断了,这样就会出问题。

所以尽管只展示出有限数量的信号(signals),但是他们在模拟现实的正确度上越来越好。接下来需要做的只是随着时间增加信号。

在之前的版本中,眼神交流全部只是 AI 模拟的,实际上我们不知道你们什么时候有眼神交流,因为我们没有追踪眼睛。现在这个版本,我们希望模拟的很多不同信号在向前演进。你将能够有真实的面部表情,并直接映射到你的化身。

总的来说,有这样一个路线图:就是关于你如何传递这种真正的在场感(presence),就像你和另一个人待在一起一样,不管你实际上在哪里。

乔·罗根:这令人印象非常深刻。(头显)追踪的方式,并不是通过把追踪器放在身上,但你认为最终会是这样吗?会像一个玩家必须要穿戴上触觉反馈套装(haptic feedback suit)才能进入游戏吗?这样,你就会完全身临其境。还是说你认为现在这种方式可以准确地模仿你身体的运动,而不需要你穿什么?

扎克伯格:我认为穿戴装备来进一步增强体验是有机会的。我们已经用触觉手套做了这些实验,如果你触摸一个数字世界里的物体,比如把球从一只手扔到另一只手,你可以从身体上感觉到你手里的球。这很酷,但我想设计成一种你不需要戴手套的方式。

所以今天有两种主要的追踪模式,其中一种是由内而外(inside-out)的追踪,你戴着头显,它会追踪你的动作、手臂,最终它还会用人工智能模型追踪你的腿。这种模式最大的优势是只用头显就可以做到这一切,而不需要有很多不同设备,甚至不用控制器。同时,头显会变得更小、更便携。你不会想有一个装置需要配 10 个部件。

也许有时候你想有那种沉浸感超强的体验,或者想在家里有这种体验,但我认为最终人们只想有可以方便携带到任何地方的产品,不管是在飞机上,还是在办公室工作,或者去咖啡店什么的。为此,你真的只想让它在一个设备上工作,所以最好只是一副眼镜或类似的东西。

VR 和 AR 是两种不同的发展路径,但它们显然从根本上是相互关联的,共同构成了虚拟现实。所以今天能继续构建 Quest 2,它现在相当流行,做得很好。并且,我觉得新版本的推出,会是一个相当大的进步。

Oculus Quest 2 | Meta

我们研究了很多新技术集成其中,但同时,它建立在几十年的先进技术和显示器技术基础之上,包括来自电视、笔记本电脑和手机的技术。其中一些显示技术的面市,本就已经建立在过去数十年的创新之上。

AR 是一个非常不同的野兽,因为你想得到的真的不是头显,你想得到一副看起来正常的眼镜。这绝非像产品线框图那么简单,因为你需要在里面装一些电子设备。大体上需要有一台电脑、一个扬声器、麦克风、电池和激光投影仪在里面,然后是显示器。

我们和许多人看中一种叫做光波导的技术,它与屏幕完全不同,因为它是一个特殊的屏幕,你在看一个东西时,基本上你就像在看屏幕上的所有像素。波导的不同之处在于它实际上是薄得透明的,所以你可以通过它看到世界,然后它会显示全息图,并能够成像放置在不同景深空间。

02 AR 将让电影、游戏不被限制在长方形的屏幕里

乔·罗根:作为一种技术,什么是光波导呢?

扎克伯格:它们可以由不同的物质组成,塑料、玻璃这样不同的基材制成。同时,它们以不同的方式被蚀刻或打印,这里尚且存在一个大的争论。现在有很多研究正在探索:哪种方法可以创建具有正确属性的波导?因为希望为增强现实提供足够宽广的视野。

所以你可以想象五年后我们会有这样的对话。我人不在这里,而你戴上我们的眼镜后,全息图版的马克·扎克伯格在这里。

这不仅仅是以一种全息图的方式运行,还有所有这些不同的维度所带来的在场感。就像,如果想远程玩扑克,我们可以玩全息图,我发一副全息图的牌,你戴着眼镜,可以身体力行地拿起全息图扑克,然后拥有一个扑克之夜,我们这些朋友就身处你物理空间的周围,只不过其中一些人以全息图的形式在这里,这实际上有点疯狂。

我喜欢做的一个思想实验是:思考世界上我们拥有的实体东西有多么少是真正需要实体存在于物理空间的?

显然,像椅子这样的东西是需要是以实际物体的形式存在的,但是大多数娱乐类的东西,不仅仅是纸牌,还有游戏、大多数媒体、电视,很可能不需要实体。它就像一个应用程序,把全息图放在那里当电视,我们戴上眼镜看你想看的任何东西。

这些东西现在被限在长方形的屏幕里,因为有很多限制,比如生产制作的物理学原理,但是在未来,会有一些高中生或大学生开发应用程序,他们会很疯狂,疯狂的东西会被创造出来。所以你最终会建造一种所有都能实现的东西。他们是眼镜。

乔·罗根:那么这些眼镜现在有没有在生产或开发中?就像你谈论的这种技术,你可以看到不存在的东西,在那里你看地图、看视频,所有这些都在一个眼镜框架里的小电脑上。它们现在已经存在了?

扎克伯格:我认为在接下来的三到五年里,会得到看起来像完整版的东西。终极的 AR 体验就像,你有一副看起来正常的眼镜,可以呈现全息图,这样你就可以随时随地与人互动。但它一开始也会非常昂贵,需要一段时间才能降到数百美元。

但是如果先放松一些限制条件,比如外形因素,你会开始看到一些版本。先有一个头显而不要求看起来正常的眼镜,那这就是 10 月份即将上市的新设备,将混合现实纳入了虚拟现实中。

混合现实是指你在虚拟现实的背景下看到周围的物理世界,它不是通过波导发生的,而是通过设备上的摄像头来捕捉世界,然后实时转换成立体图像。对于 3D 成像,因为我们有两只眼睛,两只眼睛看到的(视域和图像)略有不同,电脑把它们呈现在一起,而后你可以在上面叠加数字化的物体。

比如,当我进行击剑格斗的时候,我的人和剑都是数字化虚拟版本,否则能看到的只有大厅。所以你可以看到那些开始构建的 AR 体验,VR/AR 的体验优先于头显的外形要求(轻便)。这是行业正在探索方向之一。

另一个方向是必须以头显外形为优先级,因为想要拥有看起来像普通眼镜的东西。(然后去思考)今天我们能装在一副普通眼镜里的最先进的技术是什么?有点像从侧面出发。

在智能眼镜方面,我们和雷朋(Ray-Ban)合作制造,它们会是有史以来最畅销的智能眼镜。我们会继续开发新版本,但大体上,你可以得到一副外形像雷朋旅行者的智能眼镜。现在,它里面已经有电话、扬声器,可以拍照和录像;通过语音命令,你可以把这些发布到 Instagram 上。

雷朋旅行者 | Meta

乔·罗根:用这些东西拍摄的图片质量如何?

扎克伯格:非常好。我没有弄错规格的话,它没有今天的后置摄像头那么好,看起来像前置摄像头。它可以适配安装在眼镜的边角。

乔·罗根:如果人们开始用它拍摄,会不会带来隐私问题?

扎克伯格:会的,所以我们做了设计,它上面有灯,无论任何时候都在那里,我认为这实际上是非常重要的一部分。

乔·罗根:所以能在灯上贴一条胶带吗?

扎克伯格:理论上应该可以。

乔·罗根:所以角落里的那个小东西是灯吗?

扎克伯格:不,那是 Lastolite(丽图徕)在闪烁,它是一个非常活跃的指示器,如果你把一块胶带放在上面,它可能会干扰相机。

乔·罗根:这些「旅行者」智能眼镜和「旅行者」普通眼镜的大小一样吗?还是会有更粗的镜框?

扎克伯格:稍微粗一点,但重量差不多。之所以我们和雷朋合作,是因为他们对眼镜设计了解很多,非常敏锐,而这不是我们的专长,和他们一起工作学到了很多东西。比如在限制条件上,他们了解:在避免过重且长时间佩戴不舒服的前提下,它实际上可以做多大。雷朋是一家伟大的公司,到目前为止的合作非常棒,期待和他们一起开发更多的东西。

大体上就这两条技术路线。尽可能加上所有的功能,但是在一个比你想要的外形更大的设备上;又或者,每一两年把更多的技术加到你想要的外形上,让它成为一个更棒的设计。最终,这些东西会融合,你既会得到功能,也会得到外形,但是在一段时间内它仍然有点贵,然后在快速推进几年后,会成为主流。

但即使是今天的 VR,也做得很好。我们不会发布准确的销售数字,但它的量级与 Xbox、Playstation 或其他类似平台差不多。

当我们开始做的时候,游戏是 VR 的第一个场景。但是很快,VR 会增加不同的场景。因为人们做的主要事情,实际上是交流,这是我们在生活中获得意义的方式——与他人互动,所以这是 VR 肯定会发生的事情。如果你看看现在的顶级 App 和 VR,大多基本上是社交元宇宙,可以和朋友一起在 App 里闲逛,而不是以任何特定的游戏为中心。

从游戏开始,VR 的场景还在不断发展,它将成为一个巨大的社交平台,可以和朋友一起泡在里面,并身临其境。这些场景很疯狂,比我想象中发生的更早。

一个重要的场景是健身,VR 就像适于健身的第一个物理计算平台(physical computer platforms)。当你在用电脑时,你不喜欢四处走动;当你用手机时,你可能可以四处走动,但它有点尴尬,因为你看着的是小屏幕。但像 VR/AR 真的被设计成你能够四处走动、做事、与世界互动,这对我来说真的很重要。我讨厌坐在桌子前,那让我感觉无精打采,在浪费我的一天。

在这方面,现在已经有几家公司有一些很棒的内容,比如 Peloton 专门为 VR 打造的体验。Peloton 卖给你自行车或跑步机,然后你购买订阅,就会得到具有真实体验的课程。还有几家公司在做有氧运动、舞蹈的、拳击的课程。但是你不需要买自行车,你只需要你的 Quest 头显。

一旦你有了头显,你就可以订阅这些公司的课,在里面做不同的事情、健身,我觉得这相当酷炫,很狂野。我们都知道这些事情长期来看一定会发生,但它现在就已经发生了,比我想象的要快,这真的很酷。

03 VR 的终点不是《黑客帝国》

乔·罗根:如果你做拳击游戏,你会立即意识到这是一个非常好的身体锻炼。当虚拟拳击手向你走来、在拳台上向你挥拳时,你移动你的头,会得到非常高的心率,消耗了很多能量,这是非常好的有氧运动。并且,你发现你的脚会疼,因为一直在旋转和移动,一直在改变姿势,试图摆脱拳头。而当你继续解锁更高级别的游戏时,一些游戏比如对手会变得更加棘手,而这样的体验令人兴奋,也很有趣。最终你离开游戏时,你真的筋疲力尽了,这就是一次非常好的身体锻炼。

扎克伯格:是的。这就是整个平台的本质,也是我喜欢它的原因之一。但是,那些甚至没有试图成为健身 App,只是碰巧成为锻炼身体的项目。

乔·罗根:VR 能让两个人今晚来一场击剑比赛,这真的很有趣。在一场虚拟击剑比赛中,你面对一个方向,大约 30 英尺远,我面对另一个方向,我们甚至没有面向对方。但这都没关系。你在孟加拉国,我在罗马,我们依旧可以一起玩。但,VR 能让拳击做到这一点吗?

扎克伯格:击剑 Demo 是由我们内部团队制作的,因为我们还没有发布新设备。所以,为了让硬件发挥作用,我们自己开发了这个 Demo。

但是,拳击游戏是由其他游戏开发者、不同的开发者制作的,我不确定他们中是否支持多人游戏。我玩过的都是单人游戏的形式,确实让拳击战斗变得更刺激,我真的很喜欢《Creed》(注:一款拳击 VR 游戏)。我觉得他们能做多人游戏模式,而且也没有什么因素会阻止他们这样做。所以我想随着时间的推移,他们会增加这个功能。

乔·罗根:这似乎是一个明智的举动。如果我们谈论武术,比如泰拳等等,我认为柔术会是一个真正的问题,因为你必须在身体上有东西可以抵抗。但如果你能想做一个泰拳模式,唯一要解决的问题是当你接触到物体时,物体会改变。物体会随着人的位置和动作而改变。你可以逃脱,也可以不逃脱。相比之下,拳击在这方面非常好,这可能是虚拟现实中最好的格斗运动,因为你甚至不需要打任何东西来感觉自己好像被拳击中,你的屏幕会亮起,就像你感觉自己被击中一样。

扎克伯格:是的,做一个挥拳头的 VR 游戏更容易。柔术的话如果你没有一个特制的垫子或者其他东西,想要模拟出翻滚或者其他动作,并把人体的真实重量加进去,其实很困难。

乔·罗根:你是否想象有一天玩游戏时身体真实的感觉会变得无关紧要,因为一切都会发生在你的脑海中。不管是触觉反馈,还是其他类型的输入,即使没有真实的物体,体感却都跟真实存在一样,就像《黑客帝国》。这会是最终的发展方向吗?

扎克伯格:我不知道。但我认为我们的很多体验都是基于我们的身体,而不仅仅是我们的思想。

的确有一种哲学思想,认为人类的存在只是大脑(我思故我在)。但我一点也不认同,我不知道你如何感知事物,但我觉得我的活力和情绪,以及我与世界的互动方式,都是基于身体。随着时间的推移,通过你的大脑模拟现实世界也许是可能的,但我不相信只是大脑在起作用,我认为在所有的体验中,身体是同样重要的。

电影《黑客帝国》

乔·罗根:我同意。但我也在想,如果技术走得更远,更身临其境,更有说服力,「恐怖谷」被连接起来,突然之间你有了一个真实生活的体验,不管这是通过某种神经链接还是其他新技术来欺骗大脑进入实际体验,这难道不是未来的发展方向吗?

你可以在没有经历的情况下获得体验,这并不是否定真实体验的美,也不是说我们不再有真实的体验,而是如果你想获得真实的体验,去到另一个世界,我们可以戴着 Oculus 去那里。你可以有一个非常逼真的 3D 镜像,这太酷了。就像你认为最终通过技术的发展,可以做到让我们今天这样的对谈,在不在同一个房间都没有任何区别。

扎克伯格:推测一个事物发展的极端状态这很有趣。但我认为对技术演进更加合理的思考方式是,有些东西比其他东西更容易模仿或替代。就像我们之前谈到的 VR 健身,拳击内容现在就可以做得很好。而泰拳和柔术,也许有一天我们能在 VR 里模拟,只是这会很难,因为你需要排除各种阻力因素。

所以,我认为这种技术进步的方式是能够继续把更多的事情做得很好;同时,世界上其他技术或其他东西也在进步,任何人都无法包揽一切。

也许只是因为我每天都在努力开发这些东西,所以想的都是一些可以实现的、好的体验。一口气跳跃到一个如此好的地步当然不是坏事,但那些想法遥遥领先于我们今天实际所处的位置。我每天都在战壕里,试图早点实现它。

04 VR办公和VR社交的可能性

乔·罗根:是的,但是从长远的角度来看它的发展方向,它会变得更加身临其境,变得更好,更有说服力,这是仿真理论的真正论据。如果宇宙中有这么多文明,它们都如此先进,那么最终就必须创建一个仿真的世界。如果人类能够再生存十万年,这似乎就会发生。

扎克伯格:是的,我认为问题在于可以做到多么逼真、多么好。对我来说,这就像圣杯一样,正在建造一些可以创造人类在场感的东西。

就像我花了近 20 年的时间来打造社交软件,让你无论拥有多么有限的计算能力,都可以分享你的经历。一开始是以文本的形式,拥有智能手机和相机后变成了照片的形式。现在,移动网络已经足够好,更多内容开始以视频的形式分享。就我而言,身临其境的体验显然会是下一步。能够感觉到你和别人待在一起的这种在场感会释放很多不同的价值,比如社交的、娱乐的、职场的。

有经济学家认为,经济机会和阶层流动是有限的,这和你所处地区有关,不同的地方会有不同的机会。但是想象一下,如果你不需要搬到一些与你价值观不同的城市,就能获得所有的经济机会,那将是很棒的。所以在未来,你可以在早上使用 AR、VR 来瞬移(teleport)到办公室,然后以全息图的形式出现,这将是非常贴心的。对很多人来说,它将释放大量的经济机会。

有没有可能百分之百地像亲自在场的效果一样好?可能不会,但它依然会创造很多价值。就像讨论做这次对话节目时,我们是在电话里谈好的,我没有飞到奥斯汀来讨论是否进行这次对话。

所以无论仿真的程度如何,它都会带来很多价值。你永远无法亲身做所有的事情,但是我们会越来越多地通过 VR 去做,今天是游戏或闲逛,接下来的几年会是工作。工作场景会逐渐接近真实体验的渐进线,你能瞬移进来,以全息图的形式出现,远程工作;而身体可以住在你想去的任何地方,和你的家人在一起,无论他们住在哪里。那将会非常棒,我想我们会做得很好。

乔·罗根:这会给商业地产带来真正的问题。因为如果这样的体验真的变得像口袋里有一部手机且能打电话一样好,就不会有那么多办公室了。当可以瞬间移动(teleport)去工作时,我可能不想再去办公室工作。

扎克伯格:可能会。尽管我觉得和朋友待在一个物理空间的在场感相当重要,但是在过去的几年里,人们的工作方式是发生了巨大变化。我几乎每天都亲自见人,但同时,我在家里开的会议可能比以前多。

乔·罗根:我也这么认为。关于人们去办公室而不是在家工作,现在的确遇到了很大阻力,人们宁愿在家工作。既然可以使用互联网连接,开视频会议,为什么必须亲自去大楼里才能完成工作?

扎克伯格:是的。我也同意。在远程办公上,我们公司实际上很前卫,尤其是某些类型的工作,比如软件工程。你可以身处不同的地方的同时把工作做得很好。而且,如果你是一名工程师,有时候最好不要在办公室,因为那样人们就不会打扰你了。你可以有一整个五小时来专注解决一个问题。

就像做一些事情,我会处于一种专注状态,这时,我妻子会问我一些日常问题。然后我就失去了我的专注,但从她的角度来看,就是上帝也没什么大不了的。

所以我确实认为在某种程度上,让人们能够远程工作实际上对很多事情都很有用,尤其从长远来看,但我也认为我们需要找到远程办公与线下办公的平衡。

乔·罗根:如果我的妻子在说话,而我正好想到一个段子,我会从我妻子身边跑开,同时示意她明白。我正在写作,她进来打断了,那就结束了。所以,在某些方面,你必须有一个真正安静和安全的地方。而且我认为对很多人来说,如果你能通过AR、VR消除浪费的通勤时间和所有这些,生活中的痛苦会好得多。

扎克伯格:是。过去几年,新冠疫情让我重新思考了工作方式。我觉得减少通勤是提升效率的重要举措之一,但能够在不同的地方生活也很好。

我在夏威夷度过了很长时间,我真的很喜欢冲浪和躺在水翼船上,我会在早上醒来去做这些,焕发精神,然后再开一整天的会议。但这显然不是我在帕洛阿尔托(注:美国旧金山附近城市,Meta 总部所在地)能做的事情。我对这一切的态度很积极。

我觉得如果你能给人们「在场」的能力,可以远程工作,也可以再次瞬移到另一个地方,以全息图的形式出现并在场,这种「流动状态」会非常有价值。但它不能取代一切。

我发现对于更大的会议,最有用的事情之一实际上并不是会议本身,而是有机会在会议前后和人们叙旧。能够瞬移进出是很有效率,但也有一个缺点,你可能会错过一些在走廊或其他地方休闲的休息时间。但总的来说,我还是认为它会创造出疯狂的效率。

乔·罗根:是的,我认为人们仍然会渴望现实世界的体验,就像我做情景秀,很明显,为了获得那种体验你必须待在那里,和大家待在一个物理空间里是乐趣的一部分。

我能想象技术会演进到可以创建一个虚拟喜剧俱乐部的程度,你会看到房间里所有不同的人都戴着头显,就像新冠大流行期间在 Zoom 里讲单口喜剧,但那很糟糕,因为没有观众,像在做公开演讲,没有任何反馈。

相比之下,有一些非常棒的播客,比如像比尔·伯尔(Bill Burr)的节目,只是自言自语,咆哮着生活和其他事情,效果很好,他不一定需要有人呼应。但是,不同的事情不同,比如喜剧,没有观众不好。

扎克伯格:是的。事实上,我已经至少有过一次这样的经历。所以我们做出了 Horizon 社交平台,人们可以在其中构建世界。

其中,人们在里面构建了一个叫做肥皂石喜剧俱乐部的东西。这实际上是我听过的人们使用虚拟现实的非常感人的一个故事。

这个女人失去了她的儿子,这真的很悲伤。而喜剧对她来说,是一个非常重要的发泄渠道。但是在现实的俱乐部,在人们面前表演会让她有社交焦虑。于是,她开始在肥皂石喜剧俱乐部做这件事。同时,由于虚拟现实提供的在场感,她感觉和虚拟空间的那些人待在一起。对她而言,这种经历是一种创造性的发泄方式,帮助她克服悲伤,但分享这种极致情感的经历可能不会让她在线下喜剧俱乐部感到舒服。

乔·罗根:我的朋友 Brian Redban,在 Oculus 里做了一个叫Virtual Redban的东西。他和一群朋友同时登录,一起走进一个房间,一起在里面闲逛玩耍。这真的很有趣,有一个在线社区,在那里你们去一个地方、相互见面,彼此交谈听到对方的声音。

在里面看到的 Avatar 就像你今天给我看的那个女异形一样移动,看起来非常真实。它是一个动画,我会把它比作电影《阿凡达》中的阿凡达。在里面就像是去了电影中纳维人的世界。在很多技术之上,确实取得了很大进步,更加真实。我可以想象很多人今天就想成为一只企鹅,要去这家餐馆,去闲逛,和一群企鹅家伙待在一起,太令人兴奋了。

电影《阿凡达》

扎克伯格:这是它有点迷幻的部分。一些场景的体验比另一些更真实,因为我们记忆的工作方式是基于空间的。当我今天离开这里时,我会记得你在我对面,并且有对称性,我在你对面,我们对这个地方的空间有共同记忆。

但头显可能不是这样工作的。如果你说话是从那个方向来的,空间音频以一种定向构建事物的空间模型是我们制造记忆的方式。所以如果你用 Zoom 来聊天,会完全把它搞砸,因为你开的每一次会议看起来都一样,而且没有对称性。所以如果你在我屏幕方框的左上角,这并不意味着我之于你在同一个地方,事实上,我们没有任何共享的空间感。

我不知道你是否有过这种经历,如果我打了一天 Zoom 电话,所有的东西都会混在一起,我很难记住什么会议有人说了什么。

然而,如果你进入虚拟现实,你有一个化身,那么随着计算能力变得越来越好,它会随时间变得越来越好。我并不相信:相比更具表现力的化身,人们会更喜欢哪怕有照片般逼真的化身。这是一个完全独立的切线,我们可以往下走。你显然会希望两者都有,既逼真又具有表现力的化身。

如果你坐在那里,有人是企鹅,或者你的朋友是卡通人物,但是你们围坐在桌子旁,有一种共同的空间感,你的朋友在你的右边,你在他们的左边,当他们说话时,你听到声音从那个方向传来。事实上,你记得这种空间感,就像在物理空间一样。

我在推进所有这些细节。对我来说,这是一些最令人兴奋的工作,因为我觉得在手机上建立社交体验在某些方面受到了限制,而我们有能力定义下一个平台将是什么,让它们打破适用于电脑、手机的这些奇怪条框限制,因为这些条框不是为通信和交互而设计的,而是为某种工作和某些计算工作负载而设计的。

所以我正在尝试做的很多事情是,用一种真正以人为中心的方式设计下一个计算平台。如果你以我们大脑的运行方式来处理外部世界、思考事物和做重要的事情,你不会建立一个旨在运行 App 的平台。

你会把它建立在这样的基础上:如何与周围人互动的基本单元,你如何表达自己,你希望能够有一个化身,一种你身份的表达,能够在一系列不同的经历之间跳跃,而不是让一切都如此孤立。

这就像是一个从头开始的尝试,建立这一切是非常疯狂的,因为这涉及的领域之多和技术之难令人难以置信,我经常受到批评,因为我们在这方面投入了大量资金,仅仅过去的一年,我们就在所有这些不同的研究梦想上花费 100 多亿美元,但这种梦想的广度极其广。

化身(avatar)的所有工作,你如何表达自己,如何建立世界,然后是所有虚拟现实的东西。一起致力于今年的设备和明年的设备,以及之后的设备,还有雷朋眼镜,我们有下一个版本。同时我们也有研究走向完整虚拟现实的路径,我们甚至已经到了神经界面,但是我们肯定要在这上花一些时间。

正是如此广泛的技术都建立起来,才能基本上建立和提供一种真正的在场感。让你感觉和身处不同空间的人仿佛待在一起。我认为这是世界上最神奇的事情。

脑机会实现吗

乔·罗根:嗯,听起来就令人兴奋。你可以在丛林中拥有一间办公室,突然之间我们就一起召开这次会议,我们可以登上月球,我们可以到一个正在冒泡的火山,这一切很酷。我喜欢像你这样的人在做的这件事,这扩大了这种东西实现的可能性,但是对于神经接口,你有什么看法?比如,它在哪里?它要去哪里?我们现在在哪里?

扎克伯格:回到你对《黑客帝国》的评论,当人们想到神经接口或者任何接口时,我认为分离出来是很重要的。你给计算机的反馈,计算机给你的信息,你可以把这两个东西分开。

我实际上认为,这里最难的部分是拥有一台计算机,把信息直接给你的大脑,但这不是我们正在做的事情,Neural Link 的伊隆·马斯克在做,这是非常遥远的事情。也许它会在几十年内准备好。短期内,对于受伤的人来说,可能会有一些有趣的用例。但我认为,在未来 10 年或 15 年内,正常人可能不会想在大脑里安装什么。

脑机接口示意图 | Neuralink

乔·罗根:我不想成为早期植入者。

扎克伯格:对,你可能想要植入成熟版本的脑机芯片,而不是你需要每年升级你的大脑植入物,因为明年的版本更好。

我花了很多时间思考:如果有了 AR 眼镜,你将如何控制它?你当然可以控制任何计算设备,这是平台的基础,但你有很多不同的操控模式。

其中之一是语音,你可以和它说话,但这并不总是有效的。如果你在公共场所,或者你想保持谨慎,或者你不想惹恼周围的人,你不会大声口述一切。

第二种方法是用手。比如我打个响指,我们就会有一个象棋游戏或者扑克游戏。这是我们的棋盘,我用手移动一个棋子。这有点酷。但是,你不会像用手操纵东西一样走在人行道上。我的意思是,如果你能克服这种奇怪的感觉,就达到了基础阶段的水平。并且,大多数人的手都会累的,如果你像这样伸出你的手足够长的一段时间,最终你还是想要把手放下来。所以问题是,你如何做到:可以让你的想法给电脑下命令。

在这种情况下,眼镜不需要大声说话,也不需要挥舞你的手。对于一些场景,你不总是想要。所以我们正在做的研究,是基于它的输入。不是试图向你的大脑发送信号,而是试图让你的大脑可以与计算机通信。

我们拥有的路径是基于我们身体中所有这些额外的运动神经元。举个例子,如果你受伤了,你有神经可塑性,你可以重新连接做一些事情,比如找到一个不同的路径来发送信号,指挥你的手指或其他东西。从结果上来说,可以有很多不同的方式,让我们的大脑可以告诉手指移动。

我们已经单独优化了一些,我们加强了某些路径,使用了 11 种运动神经元路径来做一件特定的事情。最终的结果,你可以在手腕上有一个设备,你的大脑可以与你的手交流。

你的手会以不常见的模式移动,然后腕带可以接收这些信号,并将它们转化为完全不同的东西,比如让一只虚拟的手在你面前移动。而你的物理手待在身体一侧。

你将来可以有这种体验:我们坐在一起聊天,你妻子发短信给你,它突然出现在你眼镜的角落里,你想回复她。但是你不想拿出手机,因为这有点不礼貌。你不用挪动手腕,只需要做一些微小的动作,甚至没有人知道你在做,就能够传递信息。

元宇宙会让年轻人更加脱离现实

乔·罗根:这似乎会造成很多分心。我的意思是,人们已经被他们的手机分心了,比如当人们收到短信时。你坐在那里和朋友在一起吃午饭但是没有交流,因为都在看手机。如果现在他们会一直看着这些AR眼镜,只是脑海里想着这些短信,你甚至都不会知道他们分心了。

扎克伯格:我不知道。但我觉得这对我可能是一个有趣的事情,对我很有用。我一直在 Zoom 里,尤其是在 Covid 的早期,对我来说,既能在 Zoom 里视频会议,又能和更多的人聊天。或者说有些事情你不想对在场的每个人说,但是你想问某一个人,就像,嘿,你能展开讲讲你刚才说的,或者你不想在别人面前说的话吗?

这样的问题很多,因为我在公司有很多机密信息,我不会和每个人分享,但是我想得到某些人对事情的看法。如果我在开会,而且是线下办公室开会,我发现有时候我需要等到会议结束才能得到我想要的答案,而当我在 Zoom 或虚拟现实工作室里进行虚拟会议时,你可以在开会的时候给人们发短信。所以我实际上认为这将释放人们之间沟通和表达的巨大效率。人们不必等待会议结束,就可以向别人发送信息。

当然,你说的这些对于智能眼镜也是一个问题。我们可能需要的是某种非常智能的,勿扰模式。举个例子,比如你正在做一些重要的事情,你觉得某些事情不应该打扰你,这其实是一个非常重要的 AI 问题。我认为未来 AI 能够理解什么信息是应该通知你的,而不会像现在的「勿扰模式」这样黑白分明。

乔·罗根:也许是让某些人有优先权,比如如果你的妻子或家人试图联系你,他们可以通过,但是生意人不能通过。

但我担心其他问题。我的意思是,我不会让我的孩子远离社交媒体,因为我觉得社交媒体是他们生活的一部分,我不想让他们完全脱离。但我限制他们使用手机的时间,试着让他们不要沉迷于此。现在这些新事物让他们上瘾,让他们停下来吃饭都不容易,需要一遍一遍叫他们放下手机,停止和朋友拍照。

但放下手机其实还好,如果变成智能眼镜,那会更加困难,尤其是如果眼镜有社交媒体App。但智能眼镜也能提供某种好处,比如,可能会给你关于你拿起食物时卡路里含量的信息,告诉你这个食物很油,为了健康着想你不应该吃。

扎克伯格:是的。我认为这最终会达到平衡,希望我们的计算机和平台能帮助我们找到合理的平衡。就像你一直在说未来的脑机很酷,但我不确定我是否想用数字方式来实现它,我想在现实世界感受,我认为这是一个哲学问题。

我实际上认为你说的现实世界是物理世界,我认为有物理世界和数字世界,我认为它们的结合越来越多地成为现实世界。我们今天获取的信息,很多来自肉体体验以外,有的是通过数字方式,有的来自学习研究。而二者的比例可能会随着时间的推移而变化。

在未来的世界里,今天很多东西可能是物理的,比如我们的艺术品、雕塑和其他东西,也许在未来,它们不是物理的,也许它们只是全息图,因为随着时间的推移,你可以很容易地改变它们。

过去所有物质我们只与他们有物理层面的接触,很少有信息或数字覆盖。现在我认为它正在稳步增加。我认为这对我们来说可能会更健康,不是通过手机这个小窗口来展示我们所有的信息,这是我对 AR 的看法。对于数字技术是否会侵蚀现实,我可能更乐观,或者说我相信物理世界对我们在的意义。我是真的很关心如何取得二者的平衡。

乔·罗根:我认为平衡很重要,但我认为你是对的。我认为数字世界的景观不断增加,这是不可否认的,它现在是生活的一部分。随着技术的进步,它将成为生活中越来越重要的的一部分。但我不会说我的恐惧消失,我认为我们会有一天,人们会完全沉浸在一个非物质世界中,7X24 小时,我认为这就是Matrix(注:《黑客帝国》中的虚拟世界)。

这就是人们所担心的,随着技术的进步,尤其是有了某种神经接口,我们将到达一个我们不再真正存在的地方。你如何限制自己和孩子的社交媒体使用?你是怎么做到的?

扎克伯格:就我个人而言,因为在做很多事情,实际上一天中没有那么多时间。对于我的孩子,我没有时间去想那么多,因为他们都很小,一个六岁一个五岁。社交媒体是他们正在使用的东西。事实上,我希望他们将技术用于不同的事情。我教他们如何编码。我认为这就像是创造力的发泄渠道。

当我每天晚上和他们一起睡觉的时候,我试着尽可能结束我的会议,能给他们留出时间,问他们想做什么活动。是想看书还是想摔跤什么的。八月的时候,我的女儿和我说想做代码艺术,这是一种非常有趣的思考方式。她想让电脑创造艺术。无论如何,我认为这是我认为让他们接触到这种东西是有好处的。

但是我做了这些事情,并没有什么特别的地方。有很多关于幸福的研究表明,你是否积极参与其中很重要。你是在和一个人交往,还是在建立关系,还是只是在消费。如果你正在建立关系,那么这通常与许多长期利益和幸福有关,我们生活中的关系就是这样。

对我来说,这就像我认为随着时间的推移,吃东西通常会给人们带来幸福,但是如果你只是坐在那里消费东西,这不一定是坏事,但它通常与你积极参与或建立关系中获得的所有好处无关。

乔·罗根:可以在网上积极与人交往,建立数字关系,尤其是随着技术的进步,你实际上可以和某人的化身有一些有意义的经历。但这听起来很奇怪。

扎克伯格:所以,我只是想让它变得更好。从我的角度来看,这是心理问题。今天人们花了很多时间在屏幕上,基本上是电脑、手机和电视。我自己绝大多数时间都花在手机和电脑上,但我很惊讶的是,对美国人来说,他们花在屏幕上的时间几乎有一半是电视,很多人只是看有线电视或其他类似的东西。

当我们想到新的体验时,我实际上认为要做的第一件事就是干掉电视。当人们谈论担心花费的时间在不同社交产品上时,我认为要看看时间是从哪里来的。如果来自睡眠,这可能不太好。但如果它来自锻炼,我就不会那么高兴了。如果它来自电视,我对此没意见。

这实际上可能是对人类有益的,我们从消费状态转变为真正积极参与,潜在地建立关系,而不是把大量的时间花在看电视。所以在担心新产品越来越多消耗人们的时间之前,实际上只需要想想人们今天做的事情的组合变得更好。

我的目标是对于 VR/AR 这些下一代平台,它们将更加身临其境,希望它们会更有用,但我不一定希望人们花更多的时间在电脑上。我只是希望人们花在屏幕上的时间更好,今天很多时候你只是坐在那里消费一些东西。

乔·罗根:你一直是一个注重身体健康的人?我在 Instagram 上关注你,我看到你在玩滑水和其他运动,这对你来说很好,对外界来说也是一个很好的信息。这个家伙非常忙碌,他的生活被科技淹没了,但他不断地做与身体相关的事情,锻炼身体,亲近大自然。

扎克伯格:是的,我认为这是我父母很早就对我强调的事情。他们在这方面给了我很大的压力。就像你要在学校表现出色,你要加入三支大学运动队之类的。我非常感激,他们没有告诉我必须做,然后我告诉我必须做哪些运动。但他们说,这很重要。我已经找到了平衡,尤其是当公司规模扩大,在某些方面变得更加紧张的时候。

这是我的一天,早上醒来,看着我的手机收到一百万条信息,发来的东西通常都不好,因为人们通常会把好消息亲口告诉我。就像每天醒来,就像肚子被打了一拳,然后就没事了。而我需要重置自己,能够有工作动力,而不是为此感到压力。

我该怎么做呢?基本上我会去我喜欢阅读我获取所有的信息,然后我去做一些身体上的运动,一两个小时,随着时间的推移重置自己。我过去经常跑步,因为可以在跑步的时候思考很多。但尤其是在过去的几年里,我真的很喜欢需要全神贯注的事情。

所以我刚才提到,在新冠疫情开始以后,我很长时间待在在夏威夷,我们家在那里有一个农场。在那里,我花了很多时间玩冲浪,冲浪的时候你必须一直保持专注,否则你会摔倒,被海浪压在身下。我体验过,这不是什么美妙的经历。

 本文作者:宛辰,来源:极客公园,原文标题:《乔·罗根对话扎克伯格:未来十年 VR/AR 能做到什么》

风险提示及免责条款
市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。