这是 Rabbit CEO 吕骋(Jesse Lyu)在 CES 后在《This Week Startup》节目上与硅谷知名天使投资人 Jason Calacanis 最新对话,长达 90 分钟的对谈详细描述了他最新的产品思考。
吕骋强调了技术的演进是为了解决相同的问题,但以更直观的方式。他详细介绍了 LAM (Large Action Model)的工作原理, LAM 旨在提高效率、节省时间,这是一个真正的时间节省装置,让用户更多地专注于其他事情,这一理念是公司的核心驱动力。
此外,他还分享了个人 10 多年前开始的硬件创业的挑战,以及硬件创业现在与过去的不同之处,讨论了硬件迭代周期的缩短、深圳等地的制造能力,以及对低延迟技术对 AI 和数据中心能源消耗潜在影响的担忧。
以下为这次对谈的全部内容:
Jason Calacanis:
上周我们讨论了 Rabbit R1 ,它是 CES 上最值得关注的新产品之一,这是在拉斯维加斯举办的消费电子展览,也许你们在 X/ Twitter 上看过它的演示视频,这是一个看起来非常酷的产品,是一款便携式 AI 伴侣,可以放在口袋里。
它上面有一个用于导航的轮子,有一个可以翻转的摄像头,还有一个LED屏幕,我猜的,还有一个明亮漂亮的橙色,是我最喜欢的颜色,它是当场的明星产品。
他们进行了很棒的演示,今天我们邀请创始人来谈谈这个产品。在某些方面,它真的有点复古,但它拥有自定义的 LLM 和 200 美元的价格,让所有人都兴奋不已。
他们已经卖出了超过 6 万台这样的设备。在过去的五天里,他们每天都在卖出大约 1 万台。Rabbit 创始人 Jesse Lyu 就在这里,公司位于加利福尼亚州圣莫尼卡。
Jesse,你好吗?见到你很高兴。你是否预料到你的设备会引发这种反应?你是否认为它会成为最热门的产品,除了 LG 首款无线透明的 OLED 电视外?很多人对这款透明电视也感到兴奋,我甚至不知道透明电视有什么用途。如果它靠在墙上,我们能看到墙后面吗?对我来说这毫无意义。那么,这是什么感觉?你是否预料到这种情况?
Jesse Lyu:
一点也没有。说实话,我们对观众非常谨慎,也对你坦诚以待,我们预计第一天可能会销售 500 台,早期市场采用者可能会有 3000 台,这可能就是全部了。但我们确实准备好了,如果需要的话,可以加大订单。
我们也有备选计划,但我是团队中最保守的一个。我们的市场团队和设计团队可能比我们更有信心,但对我来说,我非常保守。
有一件事我必须提到的是,我喜欢这个产品。第一个原型实际上是一个带屏幕的Raspberry Pi。因为我们是一个非常小众的团队,我们去年早些时候推出了一个 Web 版本,供一小部分用户测试 LLM 的一个功能,即提前播放 Spotify ,结果很好。
我喜欢这个产品,因为我大约 4 个月前拥有了第一个原型,它的外观和手机差不多。大约 8 个月前拥有了预制的手工原型。我一直在捣鼓它。另一方面,我有点担心,也许我们只是一群极客,这只是我们自己的小玩意儿。
Jason Calacanis:
为自己制造能带来快乐的东西,至少你知道你有一个客户,就是你自己,然后你只需要弄清楚是否还有其他客户。
让我们从这个疯狂的价格开始,这个设备售价200美元。我看了一下,没有订阅费用。如果你想在里面插入 LTE 卡,你需要有一个数据订阅,
如果你想加入 5G,那就是你的事情了,只需购买 Google 的数据卡,大概每个月 20~30 美元,它们相当便宜。如果这个设备只卖 200 美元,硬件又如此精美,你如何打算从中盈利呢?我在想,你如何将这个做成一项业务?
Jesse Lyu:
我想从商业角度来看,这是最常被问到的问题之一。
首先,我可以告诉你,Jason,我们非常努力地在设计和硬件成本之间寻找完美的平衡,尽管我不能告诉你一个非常确切的硬件成本数字,因为我不允许分享,但我们确实从硬件上赚钱。
根据我观察到的和我在过去职业中学到的,硬件的毛利润非常低。如果你看手机,毛利润可能在 -25%~7%或8%之间,仅此而已。尽管如此,大多数人仍然试图通过硬件来赚钱,显然是订阅。
与 eSIM 相比,选择制作相同的托盘有两个原因,一是我们希望进一步削减设备的硬件成本,因为 eSIM 需要更昂贵的部件,而相同的托盘则不需要,但更重要的是,我们希望将产品销售到多个目的地,而不是像在美国。
我们需要与运营商进行谈判,比如 Verizon、T-Mobile 或 ATT 等。我们进展得太快,没有时间坐下来与这些公司一年时间的谈判,而现在他们主动联系我们,这非常好,所以这都是战略性的决策
首先,我想纠正一点。实际上看了你上一集关于我们的节目,我们没有制造任何 LLM 。我们使用的是神经符号模型,它不是一个 LLM ,通常我们说的是 GPT、Bard、Grok 等,这些都是基于 Transformer 的,它们需要大量的云端 GPU 来进行训练并获得正确的结果。
没有哪家初创公司能够突然间制作自己的 LLM ,就算筹集到 3000 万美元的资金也不行,所以就记录而言,我们没有这样做。我们与所有最好的语言模型和小型语言模型合作。如果有开源语言模型,将来我们也会考虑。
基本上,我们建立了一个内部评估系统,以持续监测所有主要供应商的性能,可以灵活切换,这就是 RabbitOS 的工作原理,但我们专注于 LAM (Large Action Model)。
我们确切知道,语言模型或 Transformer 是为更好地理解语言而设计的,但至少目前在完成任务方面表现非常糟糕,而且我们不喜欢与 API 一起工作,因为 API 有很多问题。
首先,你要赌所有人都会为你提供 API ,事实并非如此。对于 OpenAI 来说,鼓励或大公司鼓励所有人为他们构建 API 更容易,但对于初创公司来说,很难说服突然间有 2000 个供应商在你的 API 中按照你的格式工作。
即使你拥有所有的 API ,往往它们也不能完全复制 App 的全部功能。比如,我的上一家公司 Raven(渡鸦科技)工作时曾与 Uber 的 API 合作过,他们的 API 只能完成 10 项任务中的 3 项,要说服他们做出 App 的全部功能非常困难,因为他们没有激励,所以我们不喜欢 API 。
这就是为什么我们想要一种通用解决方案,也为通用解决方案创建了一个 AI 。无论是 Android App 、iOS App 、Windows App ,无论是什么 App ,我们都要构建一个通用解决方案,知道语言模型并不是为触发动作而设计的。
因此,我们实际上使用了神经符号(Neuro-symbolic)来开始。我们实际上开始与数据标注公司合作。根据我们自己的评估,我们开始收集真正的人与不同种类的软件进行互动,比如 Uber 、 Spotify 等常见的 App 。
我们大约在两年半前开始了这个过程。开始收集真正的人与各种软件互动的数据,然后我们建立了一个神经符号算法,它就是今天的 LAM ,你可以将所有这些剪辑放入 LAM 中,并要求我们的模型逐帧读取这些剪辑。
Jason Calacanis:
随着时间的推移, LAM 了解了页面上的像素,它知道这是一个 App ,知道我在 App 中点击了什么地方,所以当有人对 Rabbit 说:“给我订一辆 Uber 豪华车。当我回家时,我希望有五个家庭份量的寿司准备好,包括一些卷和一些素食选项。” 它会知道如何做到这一点,因为你已经训练了它很多次,观看了成百上千次在一个 App 中的互动。你需要多少互动次数?我是否正确描述了你正在做的事情?
Jesse Lyu:
你描述得很正确。首先,我们不会记录用户的操作。我们有一个测试小组,我们为他们分配任务。我们实际上与数据标注合作伙伴一起工作,以确保所有的剪辑都是有目的地收集的,而不会侵犯任何人的隐私。
我们从来不会设置东西来记录用户的屏幕。但是,你的理解是正确的。我们实际上已经在 Rabbit 研究上发布了整篇论文,其中包含幕后的内容。你可以去那里看一看那篇论文。
我们从真正的人类与这些 App 互动中收集了数据。事实是,这是非常具有讽刺意味的,因为神经符号在 CPU 上运行效果比 GPU 好,所以与 OpenAI 或任何 LLM 相比,我们的云部署非常合理,我们不会谈论数以百万计的现金,甚至不会谈论数百万美元。
我们有足够好的 GPU 集群和足够好的 CPU 云计算。我们不是按请求收集数据。只是要求人们随意玩耍,比如我们收集数据的方式。所以部署的任务可能是:“你有 10 分钟的时间在 Spotify 上,尽情尝试,做尽可能多的事情。我不会告诉你必须播放这首歌,点击这里,做那个,你可以自由探索 10 分钟。”
神经符号算法是传统 RPA 的最大不同之处。如果你熟悉 RPA,它基本上是在记录屏幕操作,当然了,但然后部署一个预先编程的顺序来导航你的鼠标、光标到x、y 坐标位置,基于绝对坐标。
Jason Calacanis:
你是说 RPA?
Jesse Lyu:
没错。
Jason Calacanis:
当你编程一个机器人时,你实际上可以拿起机器人手臂,然后将它移动到拾取东西,放入这个盒子中,然后再拾取不同的物体,放入盒子 B 中,它记录了这个,学到了这个,然后可以一遍又一遍地执行这个操作。你实际上完成了这个任务,这几乎就像是向猴子展示如何剥香蕉,然后它按照你的方式剥香蕉。猴子看,猴子学,基本上是这样?
Jesse Lyu:
那就是 RPA,但是神经符号将其推进了一步,因为我们不是通过屏幕的绝对坐标来识别所有这些元素,而是从符号方法直接提取和自动标记一些元素,并进行推理。这意味着如果一个 App 彻底改变了UI,也没有关系。
Jason Calacanis:
明白了。所以当 Spotify 重新设计它的 App ,将播客从标签中移出,然后将标签放在顶部,或者放在汉堡下拉菜单中,它仍然知道那是“播客”这个词,以及在 Spotify 中找到播客的地方。
Jesse Lyu:
完全正确。因为基本的逻辑是,这些现代软件都是为人类眼睛处理信息而设计的,它们必须有一些设置,它们必须有一些符号和文本,还有搜索栏之类的东西。
与仅仅在 GPT-4 之上构建硬件相比,这对我们来说是一个优势。首先,我想澄清一点,我们不制作任何 LLM,我们与 LLM 合作,但我们还创建了 LAM ,这是一种神经符号方法。
当我告诉 Rabbit :“为我订购一份寿司,五口之家,这么多食物,等等。” 它知道如何使用 Uber Eats App 或 Doordash App 。现在, Rabbit 设备然后向云端的某个地方发送这个请求。
Jason Calacanis:
这个请求我已经通过一个 Web 界面进行了身份验证,我已经验证了我的 Uber Eats、Doordash 账户。它知道我喜欢的寿司餐厅,然后开始了订餐过程。然后我想,它回到我这里,说:“只是想确认一下,这是你要的吗?”我说是的。然后它会做什么?它弹出一个云端的仿真器,然后你有一个具有我的登录身份验证的 Web 仿真器,这是如何工作的?
Jesse Lyu:
首先,让我们从认证开始。因为如果你考虑这个设备,它与以前的一代设备的工作方式完全不同,因为它没有预先安装任何软件。它没有预先安装任何东西。它只是一个 AI ,你可以选择启用什么样的服务。你可以选择这个设备有多复杂,有多高级。
如果你只说:“这是一个看起来很酷的 iPod ,我只想用它来听音乐。”然后你解锁音乐功能,选择任何供应商,它只会播放音乐。
但是明天,如果你想开始点餐,你必须解锁那个功能,登录过程你的理解是正确的,我们有一个 Web 门户,有点像我们自己的迷你版本的 IQ/icloud,如果你理解的话,它有助于所有的身份验证设置和功能管理。
你去网站上,你基本上选择你想要解锁的任何服务,因为再说一遍,对于 LAM 来说, Spotify 、YouTube Music、Apple Music 都没有区别,它们都是接口。事实上,Expedia 和 YouTube Music 甚至没有区别,它们都是接口。
我们给你自由选择你想要解锁的首选服务,你去那里,然后你点击“连接到 Spotify ”按钮,然后接下来会将你重定向到 Spotify 登录界面,我们不保存你的凭证,我们不触碰它们。
你点开 Spotify、 Uber 或者 Doordash,通过它们登录,然后我们会识别出这个账户已经与 RabbitOS 连接了,然后发生的是,在我们的云端,有一个非常创新的结构。
我们有一台超级计算机,当 Jason 与他的 Rabbit 谈论从 Doordash 订购汉堡时,发生的事情是,首先我们会看到 Jason 是否登录到了 Doordash 或 Uber Eats,然后我们看到 Jason 选择了 Doordash,接着在那台超级计算机上 LAM 与 Doordash 的 App 或网站进行虚拟互动,你看不到这一切,因为突然之间这一切都完成了,因为这是 AI。
然后,我们将重新渲染 Rabbit 的主题界面,为你提供结果,你也不是直接与主机互动,你只是与它对话,意图传递给 LLM。
Jason Calacanis:
你想做这个,然后 LAM 在虚拟环境中执行,然后重新渲染结果到你的设备上。这就是它的工作原理。你是否需要得到 Spotify 的许可才能这样做,或者你一旦在数据上训练了它,就可以做到这一点?我是说,获得许可是不错的,但听起来你可以不需要。
Jesse Lyu:
是的。当然,得到这些人的许可是不错的,或者我不应该说许可,我们应该开发一种更好的商业模式。对我来说,这有点像是早期,乔布斯给索尼打电话,说:如果从明天开始,因为我们有了这个设备,每首歌要 9 美分,我觉得这有点像是类似的情况。
首先,我们不是在创建新用户,我们不是在创建垃圾用户,不是在创建预付用户UIU,你是 Jason,在你的身份验证下使用他们的接口来使用他们的服务,就像你在手机或电视上使用一样。
我们花了很多时间来研究条款和协议,并试图理解。对我们来说,除非他们关闭他们的接口,这是不可能发生的,因为我们没有违反任何规定,甚至没有创建虚假用户花费。有很多浪费。
我不知道你是否看到了 Sunbird 的短信绕过 Android,有很多奇怪的方法可以设置它,但我们没有设置任何这些。
Jason Calacanis:
这很有道理,因为对于他们来说,这只是他们的用户通过基本上是声音界面的方式与他们的 App 进行交互,并在屏幕上进行一些确认。
在你发布的 1.0 版本或者你发布的 0.1 版本的阶段,这个互动是如何工作的?如果餐馆要花两个小时才能送货,或者他们停止送货。
Jesse Lyu:
这是一个很好的问题,这是我们正在努力解决的一个新问题,有一部分我们确切地知道,如果是直接操作,就会直接触发服务,如果你想听“幸运”,那就是了,播放“幸运”。
如果你想要立刻到那里,那很容易,但我们还发现了一些情况。我没有在我的主题演讲中展示的一些原因,我通过 Expedia 为整个旅行计划预订了一些内部的东西或一些与我想象的,与我想象的相当相关的东西。我们基本上想为你创建一个方式,让你一遍又一遍地检查。
确切是这样。你们每个人都有这个意思,我自己也有这个意思。所以,我们需要分开类别。有一些情况下,你想让 Uber 送你回家,那就是简单的。
如果在未来有更复杂的文本,你应该能够在你的 Rabbit Hole Web 门户上看到一份关于实际文件的副本,这就是我们想要设计的方式。你总是可以得到一个门户来检查,更合法的东西,备份和你的笔记,你的会议摘要,所有这些东西都会同步到白色门户上,这就是为什么我把它更像是我们的迷你版本的云,它实际上很小。
Jason Calacanis:
它是完全半部 iPhone ,与 iPhone 15 的厚度相同。
Jesse Lyu:
因为我有一个非常小的手,很多人都误解了实际大小。我们实际上在辩论是否应该取消屏幕,因为对我们来说,这是一个缺点。
Jason Calacanis:
iPod Shuffle 是一款非常小的产品。所以它只是变成了一个小的录音机,或者无论你可以将它制作成手表,你可以将它制作成任何数量的东西。确切地说,带我参观一下形式工厂,你用一个真的很棒的设计公司为你设计了这个,也许你可以谈谈你是如何使用它来设计它的,以及设备背后的灵感,因为它看起来既现代又复古。
Jesse Lyu:
这是标志性的。我不确定是否有信心说它已经成为标志性的,但我看到很多人为我们制作了机箱和其他东西的框架。这是一个很好的开始,至少这是我和 Teenage Engineering 之间的一个很棒的故事,我尊敬他们,他们是我的英雄公司。
大约 15 年前,我开始了与复古合成器有关的工作。当他们推出便携式合成器 OP1 时,我立刻买了下来,但制作成本非常昂贵,一开始花了几个月时间筹集资金。
首先, Teenage Engineering 不是一家设计公司,不是一个积极寻求合作并收取设计费用的公司,他们是一个非常专注于音乐技术消费品的公司,已经存在了将近 十几二十年了,非常了不起的团队。
我告诉我的团队,当我还在 Raven 的时候,如果这些家伙给我一个机会,让我去为他们工作,我会去的。时间回到 2017 年,当我正在进行 Raven 硬件项目时,我突然意识到,也许我可以说服他们与我合作,而不是我为他们工作,因为我想挑选最好的。
在我心目中,他们是最好的,所以我就写了封电子邮件,联系了他们,三天后,我就坐在斯德哥尔摩的他们办公室里,然后 Yasper 是 Teenage Engineering 的 CEO 和 Co-founder。
我们都拿出了一个笔记本和一支铅笔,然后开始画东西。在这个过程中,他问我关于,你最喜欢的艺术家是谁?你最喜欢的汽车设计是什么,还有一些 Web Chat 的问题,令我惊讶的是,我们几乎在一切事情上都有完全相同的口味,就像他问我的所有问题,他向我展示了他的黑胶唱片收藏,我向他展示了我的黑胶唱片收藏,完全一样,而且顺序也相同,他说,我喜欢这个,我喜欢那个。
我们谈论了一些事情,然后一拍即合。整个过程就像魔术一样,我想我从来没有在任何媒体或社交网络上谈论过这个,但我们实际上建立了一个秘密的 Instagram 账号。
我们没有电子邮件通信,没有电话,什么都没有。我们只是开始在 Instagram 上发布草图和视觉效果。然后,我们就像互相点赞,互相留言。就是这样,所以我们做到了。
Jason Calacanis:
这是一个公开的账号还是私人账号?
Jesse Lyu:
是一个私人账号,公开的评论。
Jason Calacanis:
这是一个有趣的方式。
Jesse Lyu:
因为时间太长了,也许以后我可以分享一些早期的作品。但我想说的是,这是两组直觉性很强的人,我们互相认识,然后有很强的协同作用。
2018 年,我正式成为他们董事会的董事,然后我对公司有了更好的了解,我明白他们需要非常专注于他们当前的路线图,他们有很多事情要完成。但我开始看到对他们工业设计的更广泛的认可,过去的 3、4 年里,我非常高兴。
Teenage 也是一家叫做 Nothing 的公司的共同创始设计合作伙伴,我不知道你听说过一家叫做 Nothing 的公司吗?他们制造手机 —— Nothing Phone。
我们也是 Nothing 的 Co-founder ,就像整个 Teenage 一样,我们帮助 Nothing 建立了最初的整个设计语言和一切,然后当我们开始做 R1 的时候,情况正好相反,我们想要创造一些酷炫的东西。当然,我们要看的第一件事是谁在那里,我们看到了一些强大的竞争对手,比如 Humane、AI-Pin、ex Apple 的人,对团队表示极大的尊重。
我告诉自己,我有点说服自己,你正在提供一种全新一代的交互软件。对我来说,提供一种没有人知道如何使用的科幻小工具实在是太冒险了。
在我的理论中,硬件从来不是首选的选择。你不是因为想制造一个炫酷的硬件而制造硬件。大多数情况下,如果你这样做,它会彻底失败。我学到了很多好的案例,我也经历了很多好的案例,你有一个很好的软件,你想要专门的硬件来让它变得更好,它总是围绕着软件,总是围绕着内部的东西。
如果你有一个非常前卫、非常新颖的软件,你想在硬件上降低风险,至少在第一代的时候是这样。对我来说, R1 是通过必要性选择硬件的结果,而不是通过偏好选择硬件。
如果我想做硬件,我可能想做很多其他的机型,就像你说的,怎么样一个花哨的玻璃?怎么样什么什么的?我们首先意识到的第一件事是,我们想建立一个良好的位置,以便我们可以与所有这些大公司和即将推出的竞争对手竞争。同时,我们也想提供一些可以与你的文化、回忆和现有工作流程产生共鸣的东西,你不需要菜单来理解如何使用它。
Jesse Lyu:
首先,对于任何单个直接操作,我现在更倾向于使用 Rabbit 。为什么呢?因为当我开始尝试完成任务时,它的速度就像思维的速度一样,我已经具备了这种速度。而且我觉得这几乎比找到那个模拟按钮还要快、更直观,甚至可以不看它,直接说话,而且 AI 的准确性足够好,执行速度也足够快。
我来给你一些快速参考。我总是在多个屏幕上,每天工作时都会同时处理很多事情,也许还要和其他人交流,如果我有什么我不知道的东西,这肯定更快。忘了闹钟,就说搜索方面,这绝对更快。然后我不得不设置一个新的标签页或者去 Chrome 开始输入。
Jason Calacanis:
你有操作按钮,有点像无线电,你按下按钮,然后定义这个词,我不需要思考,差不多 6 或 7 个步骤。
Jesse Lyu:
甚至不用那么多,一些非常高级的数字,让你快得多,我给你一个实际的例子。我正在和我们现有的一位投资人之一开会,他们会问一些关于销售和其他公司的一些数字的性能比较。
我一般不知道,我不知道去年一个公司的收入是多少。如果你考虑一下,我在 Google 上搜索,有 200 个标签页,哪一个是准确的?哪一个是正确的?这就是为什么我们设置了战略合作伙伴活动,只是为了增强这一部分,这就是单单搜索。
另一件事是音乐。我可以告诉你,你会喜欢这个的,因为它可以播放音乐,这是第二代经典 iPad,具有相同级别甚至更简单的控制。我昨天实际上有幸与 Tony Fadell 通了电话,我们通话了三个多小时,光是播放音乐,这在过去的八个月里肯定是我的首选。除了搜索,可能有 70% 的时间都在听音乐。
很多人仍然不明白。我开始在 Twitter 上发布一些东西,有一个场景我使用了视觉功能,基本上我双击相机旋转并指向你想指向的任何东西。我使用视觉来查看一个 Discord,因为 Rabbit 。过去的三天,我们已经有了 5000 名会员,而我是那里的客服人员。
Jason Calacanis:
作为创始人来听客户支持热线,那里才是离用户最近的地方。
Jesse Lyu:
我尽量回复尽可能多的信息,但我开始迷失了,因为信息太多了。我实际上在与其他人的视频通话中,然后我简单地指向相机,说,这里的人在谈论什么?很多人不明白怎么用,很多人认为,你有眼睛,你不是盲人,这太愚蠢了,你为什么要这么做?
实际上我正在做其他事情,没有时间滚动鼠标查看 50 页的内容,即使当前版本的视觉 GPT 和我们自己的视觉模型需要更快,实际上在发布之前需要更快,我正在推动它,经过 4~5 秒钟,它会说,这是一个结论。人们正在讨论 Rabbit R1 如何可能浪费工作,它给我提供了报告。
Jason Calacanis:
通常情况下,你可能会有一个受过大学教育的人,你会告诉他总结每天客户支持线上发生了什么?或者你可能会指着它,让 LLM 去做报告,这里你只需迅速拍个照片。
我也遇到这个问题。这个周末我在滑雪,一直试图用 Siri 来更改我的音乐,只是降低音量或更改曲目或播放不同的播放列表都非常痛苦,你说的是成功需要 5~10 秒, Siri 弄错了,然后你必须重新操作,然后你的音乐会被切断。
你说你按下这个按钮,然后很快地现在的响应时间,所有这些智能音响系统,你提到了几次 Raven,你曾经卖给了百度,那是你的第一家公司,我想,或第二个公司。你一定学到了很多关于声音命令的响应时间,等待那 4~5 秒钟等它醒来并理解你在做什么是多么可怕。这是你正试图解决的问题,就是前 5 秒,你如何解决这个问题?
Jesse Lyu:
如果分解一下,延迟来自两个部分。LAM 很快。如果你去查看我在 Twitter 上发布的演示,就会发现它很快。播放一首歌是瞬间完成的。
如果你问一些随机的通用问题,我们有一项技术,基本上是通过 LAM 来制作流式令牌,使它非常快速。如果你问橙子和橘子之间有什么区别?任何不需要最新信息的事情,500 毫秒以内,如果你尝试在刚开始使用 OpenAI ,那么任何搜索最新信息都会开始变慢。
我最近没有尝试过,我觉得最近又有所改进,但通常情况下,我们谈论的是与500 毫秒相比,2~3 秒的时间。但视觉部分是延迟最大的地方。
我们谈论的是大约 8~10 秒左右,但这不是我们的问题。这实际上是目前行业中最快的速度,我们正在不懈努力地寻找进一步缩短时间的方法。
现在延迟的主要原因真的只是搜索最新信息,仅此而已。如果你只是触发 LAM 的东西,那就很快。
让我告诉你一些挫折。首先,我不想携带两个设备,没有人想携带两个设备。我不是要说服人们这只是性感,所以也许你想携带。
目前我们所能做的是,我们知道它不能成为一个 App 。与你的 iPhone 相同的足迹。它实际上非常轻,只有 110g 那么 110g 是什么感觉?从你的冰箱,拿两块没煮过的排骨,就是这样,它足够轻,以至于每次我放进口袋里,都会忘记它。
我感谢自己设计的模拟按键,因为我不需要真的把它拿出来看屏幕,我伸手到口袋里,觉得那个按钮。那实际上是我大多数时间使用它的方式,只需连接我的 Airpods 或其他蓝牙设备或汽车系统,我真的不需要看它。
我伸手去摸,但还有很多事情我宁愿去手机上查看,至少目前是这样。首先是重要的社交功能。至少在这一代中,这并不是为了连接所有你的朋友,闲聊并了解发生了什么,这更注重于解决任务。不幸的是,这部分我必须回到手机上,另一部分是专业的群聊。
Jason Calacanis:
如果你想加入 Signal、WhatsApp 或其他通讯工具的群聊,它还不能完全替代。
Jesse Lyu:
我们可以,它有个托盘,有 SIM 卡,它是一部手机。我们不是在努力成为一部手机,但它有能力做到手机所有功能。另一件事是,也许这只是事实,手机实际上是一个内容消费设备,如果你想一下 AppStore 上增长最快的 App ,那就是 TikTok、Netflix、 Instagram 等等。
iPhone 有一个更好的屏幕,我不得不承认这一点。这就是为什么,当我开始考虑激光投影仪时,我不确定,因为我看到了 Humane 的演示,手势发送消息,我可能不会这样做。
当我 2013 年开始 Raven 时,我实际上是与 Sri 几个人合作的,似乎是斯坦福大学,后来成立了 Nuance,Nuance 孵化了 Siri,所以有一个很长的历史,但我记得非常清楚的是,当我第一次拜访 Siri 时,口授大约在 74% 左右,以本土英语为基础,这是非常糟糕的,但它很快就上升了。
另一个问题是意图理解。我们正在谈论的是 Transformer 之前的时代,然后在 Raven 时,我们非常努力地开展自然语言处理或 NLP 工作,那是 Transformer 之前的最佳技术。我猜想问题不是因为我们没有考虑我们可以设计算法的方式,只是当时我们没有足够强大的计算能力,比如 GPU 可以运行它,所以如果你说意图识别,它真的很痛苦,非常消耗人力,因为本质上 Alex 以及以前的每一代智能音箱,就好像你正在为这个所谓的 AI 组装一个菜单,然后你基本上是在硬编码,这是 70 种与扬声器交流的方式,这意味着你想听这首曲目,有一堆句子可以描述相同的意图,NLP 是帮助我们理解和组装这个菜单的方式,很多事情都不太理想。
我完全理解对 R1 的怀疑,这是一个语音优先的设备,因为我们都是同一代消费者,仍然患有从早期非常糟糕体验的 PTSD。
Jason Calacanis:
确切地说,这正是 Siri 让人们感到沮丧的地方,Alexa 更好一些,但在手机上的应用程度没有 Google 那么高, assistant 从来没有真正流行起来,我们只是假定它不好。
事实上,现在情况好多了,即使是使用 ChatGPT 的 App 也是如此。我现在用 iPhone 15,它有一个动作按钮,类似于你在 Rabbit 上所做的,我把它连接到了 ChatGPT 的语音界面,当我按下它时,它在 App 中进入了那个对话模式,这非常好。
在美国,它会迅速运行,你什么时候会知道你已经制作出一个可以挑战口袋中的手机的产品?你会赢得回家拿哪个设备的比赛,如果你忘记了你的手机,你会回去拿它。如果你忘记了你的钱包,你不会回去拿,你会说,我忘记了我的钱包。我的电话上有一些支付选项,如果你没有它,你得回去拿,当你达到这个里程碑时,我必须掉头回去拿我的 Rabbit。
Jesse Lyu:
首先,挑战是一项雄心勃勃的任务。我们从来没有自己设定,至少在心态上,我们从来没有自己设定,就像 Rabbit 的整个目的是要杀死 iPhone 一样。
不管它是什么。另一方面,我们深刻理解,特别是由于我的经验,我的公司被卖给了百度,我们有一个非常独特的工作关系,仍然保持着 Raven,但我已经看到足够多了,不仅是百度,还有微软,所有其他公司,大公司是如何运作的。
我们目前的看法是,我们不认为我们有信心挑战它,但我们也不想等待。就像你可以成为用户,我在 Twitter 上发布了产品,成为弄潮儿、旁观者,还是陪跑者?你只能成为这三种的一种。
我们不是说有多少雄心勃勃,或者妄想,我有一个非常明确的总体计划,这不是创业公司的性质。我有很强的信心的一件事情是,对于所有这些基于 App 的操作系统的当前一代,要想改进是不可能的,因为技术不是,根本操作系统的转变,它永远不会是一种改进,它总是重新运作,它总是相关的。
问题不在于技术。很多工程师在工程师的角度上有不同的看法,他们认为只是这样做 Siri 就变成了 R1 ,那里就成了 RabbitOS。
不是这样的,问题是他们赚钱的动机背后,他们建立了一个拥有数十亿开发者和数十亿 App 的整个 AppStore,突然间没有 App 了,这怎么可能?
我看不到一个非常顺利的过渡,它怎么能够如此迅速地改变?我们认为应该等一等,进一步降低风险。我认为,考虑到 R1 是 iPod ,对于我们正在讨论的一定数量的请求来说,它是比 iPod 稍微宽泛的要求,因为 iPod 确实只是为了取代 Walkman,但在 iPod 时代,你仍然用黑莓电话,我用黑莓 8900,我有我的 iPod,你有两个裤袋。
Jason Calacanis:
每个裤袋放一个。
Jesse Lyu:
完全正确。它有点像固定形状,如果你穿牛仔裤,你甚至不想摸它,你只是放在那里。但我们有 R1,这是我们对未来结构的第一次尝试或方法,未来软件将如何与人类一起工作?你如何与软件互动?也许在一年半到两年内,我们会有一个更好的答案。
Jason Calacanis:
现在,你要去找那些早期采用者,想要尝试它的人,想要投入时间并给你非常好的想法的人。有没有 App 开发者直接来找过你,只是想直接为你的 LAM 制作东西,提供接口, Uber 的工程师和你的工程师可以在同一个空间中无缝运行,实际情况是这样么?
Jesse Lyu:
实际上这是双方的。一方面,我们在 Twitter 上通过握手方式进行了交流,没有预先沟通,现在我们为前 10 万台设备提供 200 美元的 Credit。如果你考虑设备本身,价格只有 99 美元。更重要的是, RabbitOS 最被低估的特性,目前还处于实验阶段,但我们有信心很快在用户收到设备后推出至少是 beta 的版本,这就是教学模式(Teach Mode)。
教学模式如何工作?实际上你之前解释到了,就像猴子对猴子,你去这个网页门户, Rabbit Hole,打开教学模式,你决定今天我要教你点什么,就像你在教你 8 岁的孩子一样,你会说,来找爸爸,坐在这儿,看我在做什么,学吧。
如果你考虑神经符号学,同样的比喻,背后有一个心理因素,如果我让你教我滑板,你是否愿意?有两个决定,一个是你是否愿意做;第二,即使你想做,你可能也不愿意做。但更重要的是,如果你根本不知道如何做,你只会说不。对吧?所以你作为用户去教学模式,你确切地知道你要教什么。
Jason Calacanis:
对吧?如果你从来没有滑过滑板或滑雪,你是不会去教滑板如何使用的。但如果你说,嘿,我该怎么滑雪呢?如果我选择这样做,这将是很好的训练数据,这就是你的想法。如果有一个 App 人们没使用,就像你还没有训练 Twitter ,我可以说,让我训练 Twitter ,去记录我的回复,我提及的内容,我喜欢读的内容,然后请马上大声告诉我其中 5 条内容,但不需要你朗读日期,只是想让你读内容,只需读前 200 个字,而不是整个内容。
Jesse Lyu:
完全正确。你已经在使用这个功能了,这就是它的强大之处。教的时候,你知道你在做什么,你收集的数据,我们不会记录在你的本地设备上。我们启动虚拟机,这是一种旧技术,你进入虚拟机,选择你想要教的平台,然后开始教,这个录音非常干净,RabbitOS 可以获得一次性的机会。
Jason Calacanis:
所以你让整个社区来教 RabbitOS。
Jesse Lyu:
构建你自己的 Rabbit,这就是我们赚钱的方式,顺便说一句。
Jason Calacanis:
明白了。我可以制作一个 Rabbit ,那将是我解释 TikTok 或社交媒体 App 的方式,就像我们谈到的那样,然后我可以出售这些,我可以卖给其他用户我的 Rabbit。
Jesse Lyu:
我们不是在重新发明任何商业模式,这是经典的 App , Apple 的 AppStore 或Google Play 商店获得的逻辑,但我们不担心从现在开始赚钱。
Jason Calacanis:
像这样制作硬件设备,构建这些东西,你需要多大的团队?我们看到很多人用更少的资源做更多的事情,我很好奇。
Jesse Lyu:
迄今为止,我们有大约 17 个全职员工,但我们正在招聘,但我也与优秀的 ODM 以及 OEM 合作。在过去 Raven 职业生涯中,我有资源,这是同一个团队加上,设计部门和十几岁的孩子帮了我们很多忙,但我们正在招聘,正在努力制作 LAM 的未来版本。
考虑一下,这是 LAM1,我们正在设计 LAM2,明年将会更加有趣,具有不同的手机特征。总体想法是,我从我以前的公司中学到了,如果你的目标是在第一天就赚钱,你可能根本不会成为一个消费者硬件公司,你会变成一个.....怎么说呢? 更像是 Oracle。
Jason Calacanis:
你似乎受到了 iPod 的很大启发,如果你想想 iPod ,我不知道你是否还记得,第 2 代 Shuffle,这是我的最爱。我相信 Apple 的巅峰疯狂,它是一个夹子,几乎就像一个领带夹。
Jesse Lyu:
短一点的头,耳机线短一点,他们也没有改变,我记得它是一个环,我也有。
Jason Calacanis:
一个短的耳机线,因为他们知道你要把它放在腰部以上,你不需要把它跑到口袋里,但它也有物理控制按钮,所以从那个角度来看,它非常优雅,物理上有滚轮,这个滚轮在这上面有什么作用?
Jesse Lyu:
我们正在研究不同的想法,我不能分享太多,但我可以分享一个正在研究的想法,这是如何解锁你的设备。
Jason Calacanis:
当你在高中的时候,你的密码就像一个锁,两次左转,两次右转,那真是太聪明了。
Jesse Lyu:
带有触觉提示,而且没有人会知道的,它甚至不是一个文本或什么的。
Jason Calacanis:
太酷了。所以会有不同尺寸的,你说你实际上不需要屏幕,你需要制作自己的响应式耳机吗,还是你认为是蓝牙的?
因为我有一个问题,我有我的 Airpods 第三代,它非常优雅地工作,但我更喜欢 Pixel Buds,我不知道你是否用过 Pixel Buds,但它们是扁平的,他们是更加优雅的设备。
如果你使用滑雪头盔,如果你睡觉前想听播客或像我一样听有声读物,它们更好。那么你怎么看?因为如果它是一个独特的耳机,那么我会有硬件收益或用户界面收益吗?
Jesse Lyu:
如果你从内核的角度自定义,你可以进一步降低延迟,延迟是个问题,特别是在汽车系统中,这就是为什么所有的汽车理论都不起作用的原因,因为汽车系统的延迟是非常好的。它的蓝牙 5.0,它默认适用于任何不同的默认机场和第三方制造商。我更感兴趣的是,也许我们可以做一个 Rabbit Airpods ,但它是完全独立的。
Jason Calacanis:
这太有趣了。所以你把它们戴上,它就是你的 Rabbit 版本。我只需与它交流并进行身份验证,我只带着我的 Rabbit Airpods 出门,说给我订一辆 Uber,它说 OK,Uber Black、Uber X 或者 Uber SUV,这太酷了。
Jesse Lyu:
这些挑战来自一个方面,你在等待一个更小但更强大的芯片。如果我做一个 Airpods Max,我可以很容易地做到,我现在就可以做到,但如果你想做得对,就会有一些挑战。
Jason Calacanis:
在你的情况下,必须有 SIM 卡或 eSIM 或其他什么,电池寿命开始起作用了。有很多不同的问题,这是一个绝妙的想法。如果你有头戴式耳机,而 Rabbit 内置在其中,然后你只需要那些。有没有人曾经在耳机里放过 CPU ?我从来没有见过,那将是令人惊叹的。
Jesse Lyu:
深圳或秋叶原肯定有一些这样的产品,我们可以去找找。理论上,我是说,深圳已经查过了,我打电话给我的朋友,确认那里有,高通以及 Apple 正在研究这个问题,我们不仅仅是在谈论。
Jason Calacanis:
他们可能会推出这个,你认为他们可能会推出吗?
Jesse Lyu:
这是每个人正在努力的方向。
Jason Calacanis:
我会戴上我的 Airpods Max,不管他们叫这些什么,那么我喊 Siri 进行播放,不需要带着手机,它有内置 Wifi 和 LTE,那将是惊人的。
Jesse Lyu:
Jason,我给你看点东西,这是 R1 的实际主板, 我们甚至没有试图使它更小,因为看看手机的形状,它很合适。如果我非常努力地尝试使它更小。
Jason Calacanis:
它是一张扑克牌的一半,如果你把黑桃剪成一半,这就是主板的大小。
Jesse Lyu:
所我们现在可能可以做到,但我想做 Airpods 版本,那会有一点挑战。另外,因为你想要将其设置为始终监听,电池也是一个问题。
Jason Calacanis:
监听需要更多的电池。
Jesse Lyu:
我对未来 48 个月非常有信心,我们可以开始研究这个问题,但另一件值得考虑的事情,我没有泄漏我说的任何东西,这只是我的思维逻辑,这是我们接下来要做的事情。
Jason Calacanis:
这不是产品路线图。
Jesse Lyu:
这不是,我们只是随口说说。手表也是一个很有意义的选择,社区成员中已经有很多人在 Twitter 上设计了 Rabbit 手表并标记了我,做得很棒,但如果你仔细想想, Apple Watch 可能是他们整个产品线中最弱的产品。
Jason Calacanis:
我必须说,直到 Ultra 出现之前, Apple Watch 都不怎么样。电池寿命更长了,屏幕尺寸更大了。当我跳入水中时,它会告诉我我在水下多深,它的电池寿命实际上能够持续 2 天,与其他产品相比,这是一个巨大的改变,屏幕比其他产品大多25%,它的屏幕非常亮,100% 非常亮。
Jesse Lyu:
这也是一个重要因素。我的意思是,从我自己的经验来看,也许 Apple Watch 在他们整个产品线中是最弱的,因为它是一个配件,不是一个独立的设备。
Jason Calacanis:
他们确实没有将其作为一个独立的设备来关注,我同意。
Jesse Lyu:
他们说它是一个独立的设备,我明白你可以打电话,我明白有些功能,但有些地方做得不好。
Jason Calacanis:
打电话不好。
Jesse Lyu:
一些 Youtuber 用它做了一周的挑战。我看到 Youtuber 挑战了。我觉得有人真的用他们的 Apple Watch 一周,它可以工作,但它不是为这个设计的。有一个很好的机会或想法,因为我开始关注孩子和他们的设备使用方式,这是社区的一部分。
Jason Calacanis:
在我们继续之前,我只想在现场展示一下,这是一个粉丝制作的作品,所以对于正在观看的人来说,它是标志性的橙色,非常华丽。然后它有像是冠军一样的表冠。但最棒的部分是它有一个弹出式相机,屏幕上设计有一个弹出式相机的小缺口,完全不切实际,但很棒。
Jesse Lyu:
它保留了所有关键的元素,像通风孔,通风格栅等,令人印象深刻。
Jason Calacanis:
这个社区是如何开始的?顺便说一下,因为你是不是引导了这个疯狂的工业设计社区,还是他们跟随着 Teenage Engineering ,叫什么来着?Teenage Engineering ?
Jesse Lyu:
是的。
Jason Calacanis:
Teenage Engineering 鼓舞了工程学生或其他工程师,因为看到了多少人开始制作你的标志性产品的衍生品扩展。
Jesse Lyu:
确切如此。首先,我要非常感谢 Teenage Engineering 。如果你曾在设计或工业设计或音乐方面工作过一天,他们都是最高级别的。至少这是我的观点。我不在乎有人是否同意或不同意我的观点。在我心中,他们是最顶级的,这是一部分。另一部分是,Jason,手机现在太无趣了,工业设计基本上已经死亡了。
Jason Calacanis:
我可以解释一下,因为我不能告诉我的过去五代 iPhone 之间的区别,确切如此。
Jesse Lyu:
像手机公司一样,它们坚守着它们当前的乐趣因素。通常,如果我们考虑一下有趣的时光,让我们考虑一下 Sidekicks、Engage,想想那些东西,像翻转的诺基亚手机,这已经过去很久了。
如果你看看过去,尤其是过去的五年,三星和 Apple 是一个很好的例子,现在它们已经成为了经典,我看到了 iPhone ,我知道那是 iPhone ,我看到了Galaxy,我知道那是 Galaxy 手机,但我也可以 100% 地告诉你,下一代将会看起来一样,只是颜色不同。
Jason Calacanis:
这是因为制造成本的原因。制造这些新版本非常昂贵,这就像汽车一样。一旦你为丰田普锐斯制造了一辆新版本,每次重新设计它,你都要重新启动整个生产线,而且你得不到任何规模效益,所以这是一个规模业务。你试图在竞争激烈的市场中获得巨大的利润,所以他们不改变。
Jesse Lyu:
乔布斯并没有。
Jason Calacanis:
他并不在乎,你可以肯定他并不在乎。
Jesse Lyu:
只是这种精神通常已经消失了。我们没有帮助,我们没有基本上在做这件事。这是我们所有人作为消费者的共同感觉,如果你带来了新鲜的东西,它相对便宜,我们是一家新公司,但人们通过看它来感受到快乐,然后这启发了他们创造自己的变种,这是另一轮涟漪,这个涟漪会不断扩大。
我真的很理解为什么 Kyle Pay 在一开始就创立了 Nothing,我们有几次聊天。他整个公司的立场是手机很无聊。
Jason Calacanis:
我是说 Nothing Phone 太疯狂了,你喜欢Nothing Phone 的什么?什么激发了你?
Jesse Lyu:
他们可能是最注重工程和工业设计的公司之一,提供更好的事物。他们刚刚创立,大多数初创公司不会在这两个基本领域投入这么多资金来制造产品,我要非常感谢他们,我没有直接参与他们的管理或其他事务。
但是,与 Teenage Engineering 在一起,从一开始就看到了这家公司的发展,这是一段相当艰难的旅程,它非常具有挑战性,他们的东西不便宜,你可以看出它不便宜。
Jason Calacanis:
它不便宜,是一种奢侈品,他们试图制造它,它是一种奢侈品吗?
Jesse Lyu:
嗯,它仍然比旗舰 Android 手机便宜 100 美元左右,我会这么说,但它不像深圳的东西那么便宜。如果你考虑年轻一代,比如在 2000 年后出生的所有孩子,当他们长大后,他们首次接触手机,然后在过去的五年里都是一样无聊的东西。这有多疯狂?想想当我们开始拥有手机时,我们有 200 多种不同的选择,我们之所以买手机,只是因为它很酷,就是这样。
这一部分大多已经消失了,这是因为制造业务背后的东西,但是对我们来说是好事,因为我们太小了,刚刚起步。
Jason Calacanis:
你们承担了巨大的风险,你们没有什么好失去的。
Jesse Lyu:
就是这个原因, Siri 、Google Assistant 或 Alexa 不可能如此迅速地迎头赶上。
Jason Calacanis:
我必须扔掉它。老实说,技术发展得如此之快,以至于 Siri 和 Alexa 需要被扔进垃圾桶,他们应该重新开始一个新的项目,这样实际上会更快。
Jesse Lyu:
我同意。Siri 的技术一定是惊人的。整个范式已经发生了变化,变成了 LAMs 和 LLMs,而它们并没有建立在这个基础之上。
Jason Calacanis:
我是说,它需要扔掉。如果你看看 Elon 正在做的自动驾驶,他不会害怕说,我们制造了这个软件来保持车道,但是它并不是,有新技术将会颠覆它。我们需要转向新技术。现在,硬件堆栈可能不会改变, iPhone 的硬件堆栈可能完全相同,但 Siri 必须消失。
Jesse Lyu:
我想给 Elon 非常大的赞赏,因为他的一些思考方式确实让我产生共鸣。一个例子是,如果你看看 Cybertruck 中的所有电缆,我不确定你是否订购了一辆,但它马上就要到了。
如果你看看他们如何重新设计电缆,这太疯狂了,因为所有的汽车都有,什么,像现在有大约 10 英里长的电缆,都绕在不同的支柱上。他不喜欢那样,他认为那太复杂了,这些想法真的推动了很多创新。
从我们所受益的地方来看,就像你说的,我们很小,我们承担风险,但这是我们想要思考事情的方式,我们不是说,也许我们再等两年吧,还有更多的 API 可以使用,也许我们可以穿上西装,走进 4 个 App 的办公室,与他们的高管谈话。也许我们可以达成交易。
我们的想法是我们不再使用 API ,我们不再使用 App ,我们只是从头开始做一些事情,我们从中获益匪浅。
Jason Calacanis:
Cybertruck 采用了 48 伏特的系统,这降低了汽车中的总电缆长度,减少了80%。现在我猜唯一的缺点是,如果你丢了那根电缆,汽车就完了,失去了很多,但好处是,如果出现问题,更容易诊断,你只需更换电缆。
Jesse Lyu:
很难丢失这根电缆,因为你有防弹板。
Jason Calacanis:
确切如此。我是说,Joe Rogen 试图用箭射它,但没有成功,而且他的射击技巧相当不错。你们很安全,Jesse,你是一个了不起的嘉宾,我希望你在它发货时再来,你认为人们什么时候可以拿到这些设备?你最好的估计是什么?
Jesse Lyu:
我们的承诺日期是复活节,也就是 3 月 31 日,那是我们开始发货的时间,我们正在与当地的合规和法律团队合作,以尽快发货国际订单。
国际批次可能会在 6 月或 7 月,但我们正在努力加快一切,但我们可以分配大约 50~100 个媒体测试设备的数量。
Jason Calacanis:
感谢你把我包括在内,我非常兴奋。
Jesse Lyu:
你已经自己报名了。预计在 2 月中旬左右,在接下来 2~3 周内。从下周开始,我将开始发布所有在主题演讲上展示的演示,我已经在这里和那里展示了一些,但正如我所说,延迟是我们真正关注的问题。
Jason Calacanis:
你们一共研发了多少年?顺便说一下,人们不太欣赏的一点是,这不是你过去6年一直在做的事情,创建硬件初创公司的能力与你 10 年前开始时大不相同。
深圳的成熟度,仅举一个例子,当我第一次去深圳时,我想是在 2006 年或 2007 年,当时很少见到美国人,一个白人,所以当我去那里时,不要开玩笑,有 20 名学生围着我,想要触摸我并与我合影,因为他们从未见过,因为他们来自北方。
在深圳有一个著名的游乐园,不是为美国游客准备的,而是为中国国内的游客准备的,我去那里只是为了看看,我真的被拦住了,10 次左右,人们想要触摸我并拍照。
现在有很多美国人,有很多初创公司在那里。当我在 2007 年去那里时,我猜是 15 年前吧,更多的是,会有一幢高楼大厦,30 层楼,然后,在周围的四个街区里,都是停车场。你会从一栋建筑物开到另一栋建筑物,你可以看到你要开到的建筑物,但就像开车穿越沙漠,你知道吗?
Jesse Lyu:
我在中国出生,但我是在一个非常西式的家庭中长大的,我的父母会说,一旦你满 15 岁,你就得自己照顾自己。
我 15 岁后就开始学英语,然后他们说,一旦你独立,我真的在 15 岁的时候离开了家。我有一次获得了一个转学机会,短暂地在新加坡的一所高中上了一段时间课,然后我去了英国,我毕业于利物浦大学数学专业,然后在伦敦又待了一年半,只是和一群艺术家呆在一起,所以我现在真的不太了解中国,我已经离开这个国家很久了,但我相信你,情况已经非常不同了。
深圳的 ODM 和 OEM Infra 已经建立了几十年,至少仍然为 Apple 等公司服务,所有的 iPhone 都是在那里生产的,但很多事情开始有所变化,因为从硬件角度来看,我能看到很多事情都变得模块化了。另一方面,核心芯片正在变得集中化。
Jason Calacanis:
核心芯片正变得集中化,TSMC。
Jesse Lyu:
Nvidia 正在加强这一点,或者说 arm 和其他公司正在加强这一点,但是组件,任何人都可以制造它们,然后将它们插入这些 CPU 中,任何人都可以制造它。
Jason Calacanis:
但是,深圳的速度仍然无人能及。
Jesse Lyu:
这是一个很酷的地方,他们可以为你制造全新的东西,然后在几天内将其送回到美国办公室。完全可以迭代。迭代周期以前是几个月,现在是几周。
Jason Calacanis:
现在肯定是几周,如果你有一些特殊的资源,你甚至可以在几天内完成,这是令人难以置信的。
Jesse Lyu:
是的。想想看,以前迭代周期是每季度一次。因为我曾经试图在 10 年前投资过一些硬件初创公司,迭代过程太慢了,你无法灵活应对。现在你可以在几周内完成,甚至可能在一周内完成,这真是不可思议。
Jason Calacanis:
那为什么你认为芯片的集中化对初创公司来说不太好呢?
Jesse Lyu:
因为你只会与精选的合作伙伴合作,然后他们有很多大客户需要合作,然后他们会说,如果你的销量没有超过这个数字,我们甚至不会和你谈。
Jason Calacanis:
明白了。你认为风险和开源芯片运动会在未来产生影响吗?风险对开源芯片有什么看法?
Jesse Lyu:
这更多是关于你如何设计一个系统。很多人在争论,我一直在争论,也在我的 Discord 社区中与我的社区成员争论。
很多人说,我们能不能制造本地 LLM 呢?我们能在设备上运行 x 数量的功能,而不是在云中运行吗?对我来说,我能理解出于隐私原因,那可能是唯一合理的理由。
Jason Calacanis:
为什么你愿意在本地运行呢?有多少人关心这个问题?关心的人很少。如果你将我的指令加密,然后在云中执行它们,然后删除它们,这有什么问题,或者每隔 60 天删除一次,可能需要保留一些历史记录。
Jesse Lyu:
这只是学术观点和消费者观点之间存在巨大分歧的一个方面,消费者不在乎。
Jason Calacanis:
确切如此。我提出这个案例的方式是,有一种方法,我们可以朝着 Chromebook的方式前进,即使操作系统也在云中。如果我们选择这条路线,那么我们就不用担心芯片的问题,因为你不需要那个芯片来在本地运行大量任务。
Jason Calacanis:
它是一个终端,你把终端打开。
Jesse Lyu:
实际上,我支持这条路线,因为从消费者的角度来看,我为什么需要在我的汽车中拥有 CPU ?或者是电视机?为什么我需要那个?而且,一切都是智能的。
电视是智能的,一切都是智能的。我实际上正在设置一个小公寓,因为我变得太忙了,我不再呆在办公室。我正在设置电视,然后我需要从我的电脑上进行 Airplay 操作,所以我去了商店,买了一个Apple TV,然后我买了一台三星的智能电视,它们都有 Netflix。
Jason Calacanis:
现在你有两个遥控器,其中一个三星遥控器上有 Netflix 标志,就像我为什么要买 Apple TV?
Jesse Lyu:
确切如此。然后三星有他们自己的 Chromecast 或其他什么,应该是这样。如果你想想背后发生的事情,我们需要所有那些吗?我们是否真的需要在电视上安装高通芯片,如果你的电视可以投影东西,那就是电视应该做的事情,所以,这是一个有趣的趋势,特别是在接下来的几年里,我们将看到谁能占上风,本地公司与云公司,以及它们的工作方式。
我同意 Elon Musk 和其他一些人的观点,如果 AI 运行在这种方式下,我们将面临电力短缺的问题。
Jason Calacanis:
我们将面临家庭用电和数据中心用电的实际电力短缺问题。我们将需要更多的电,因为这些设备运行得很热。
Jesse Lyu:
是的。如果我们保持目前的速度,我们真的没有足够的晶体管和 Transformer 来处理 GPU 集群,那么很多 Infra 都需要关注。现在如果因为 H100 型号太多而出现能源危机,人们将再次对核能感兴趣。所以人们会说,我们只需要在这些数据中心旁边建一些核反应堆,并建设大规模的太阳能农场,以获得更多更便宜的能源。
Jason Calacanis:
这就是,人们一直没有太多考虑的原因,因为我们一直能够跟上,但是如果突然间我们无法解决癌症,因为我们没有足够的能源,我们没有足够的芯片来治疗癌症,我们有那个软件,我们有芯片,我们没有足够的能源来将这种定制药物治疗的重点放在某个地方。
Jesse Lyu:
对我来说,消费者离实际问题有多远,对我来说是很重要的,如果你距离问题很远,你不会关心。但是如果你在旁边,然后突然间成为一个问题。所以,就像我说的,我们不知道这是否是正确的手机因素。我们不知道,但我们知道这是我们可以承受的最低风险,我们知道 LAM 是最重要的。
Jason Calacanis:
LAM 就像狙击手一样,你可以很容易地完成任务。当我们在这个行业开始时,我记得在 90年代,有家公司叫做 General Magic,他们正在制造一个带有 Agent 的设备。你会告诉 Agent,我想飞到巴黎。
我的意思是,它会知道你在纽约,然后它会出去,尝试为你找到机票,然后去找一位旅行代理人,然后试图找到结果,然后将它们以某种格式放回来,以便你可以说,好的,我喜欢这个行程安排。现在,2000年、2005年、2015年、2025年,经过了30年,很有趣。
Jesse Lyu:
General Magic 是 Apple 的一个内部项目, Apple 并不真正了解它,所以将其分拆出去了,他们的标志是一个带着帽子的 Rabbit。
Jason Calacanis:
对,我记得那个。Rabbit 会在小动画中伸出头。我记得索尼为 General Magic制造了第一台实际的硬件。
Jesse Lyu:
一些早期版本的 PDA 和其他东西。
Jason Calacanis:
个人数字助理,我记得当 Palm 在纽约推出时,大约在 97、98、99 年左右,人们都有一部 StarTech 手机和一部 Palm,你拿出这两个设备,然后你学会了 Palm 脚本。
你学会了如何在触摸屏上进行脚本编写,而不是发送钱,那是 Elon 和 Peter Thiel 要做的事情,或者说 Peter Thiel 要用 Paypal 来做的事情,它是用来发送名片的,而 iPhone 15 的最新功能是通过敲击两部手机来发送名片,这太滑稽了。
Jesse Lyu:
这实际上是一个很好的观点,因为我深信,人类从来没有发明新的需求。我们有一定类别的需求,我们想休息好,我们想吃好喝好,想娱乐,想有动力,想开始工作。
技术并没有发明新的需求。技术一次又一次地解决同样的问题,但每一代都以更直观的方式来解决。这正是你说的,用 Palm 发送脚本到名片,与现在的敲击两次错误放一样,它是一样的,更加直观。
硬件非常有趣,因为如果硬件足够直观,那么手机因素会保持很长时间。你永远不会,我从来没有听说过每年有 2000 家公司声称他们能制造更好的锤子,为什么?因为它足够直观,它只需要你的力量和遵守基本规则,就是这样直观。
如果你考虑一下计算机和移动设备,还有很长,很长的路要走。这就是为什么我们决定向前迈出一小步,我们说,我明白你们对这个或那个持怀疑态度,但我们必须尝试,至少我们必须这样做。
Jason Calacanis:
有一种瞬间的特性,如果你告诉人们,我一直认为,当我寻找要投资的初创公司时,这家初创公司是否在为人们节省时间?它是否在为人们省钱?或者它是否以某种方式娱乐人们?
如果你看看你的设备,它将会为人们节省时间,而时间对于一些人来说相当于金钱。有些人比时间多,有些人比金钱多。
总的来说,你的设备是一个节省时间的设备,它会娱乐人们吗?当然,可以有娱乐服务,首先是为人们节省时间,让他们回到孩子或晚餐或其他事情上,离开他们的设备,这真是不可思议,你的意识到延迟必须改变,毫秒数要降低,人们会搜索更多。如果他们使搜索结果更快,人们会更多地使用 AI。
Jesse Lyu:
我可能可以在你有测试设备的时候得到它。
Jason Calacanis:
这将是令人惊叹的,只是点餐的能力更快。我为我的家人点的是同一种寿司卷,那种手卷。如果我能重新点那个卷子,秒杀,而且我能越快越好。当这个东西在三个月内推出时,你会再次来吗?
也许我们可以亲自见面,也许我们可以做一些。你知道吗?当你准备好推出它时,留下一些演示,比如三个,我们可以现场演示。
Jesse Lyu:
我们将创造实时,进行实时演示,为什么不呢?
Jason Calacanis:
我们将亲自进行现场演示,我会租一个剧院,我们可以坐在那里聊天,我们可以现场演示一些东西。如果你想了解更多信息,或者如果你想与 Jesse 一起工作,做疯狂的、令人敬畏的、酷酷的事情,就像乔布斯一样,人们如何了解你的职位空缺?
Jesse Lyu:
很简单。我们有一个职业页面。我们不断更新职位。但只需通过 Twitter 联系我,或者随时发送一封 Rabbit 或技术的电子邮件。只需访问我们的网站,发送电子邮件,我们的网站是 Rabbit.tech。
Jason Calacanis:
Rabbit.tech,确保查看研究页面,以获取有关 LAM 如何工作的详细说明。
Jason Calacanis:
你们的关于 LAM 工作原理的页面真的很酷。
Jesse Lyu:
只需给我们发送一封电子邮件,我们会处理的。你们是在招聘什么职位?
Jason Calacanis:
你们最难招聘哪些职位?
Jesse Lyu:
基本上,我们需要在每个方面扩展大部分与产品相关的职位,因为我们正在努力赶上需求,还有很多我们正在尝试为未来构建的东西。更重要的是,我们想建立一个 LAM 研究小组,专门致力于未来的 LAM 版本。
Jason Calacanis:
你现在是亲自在办公室吗?你在圣莫尼卡亲自办公,试图让人们来办公室。
Jesse Lyu:
但如果你很优秀,就可以灵活。但是,如果你真的很优秀,让我告诉你一些,住在圣莫尼卡,有很多很棒的餐厅,这是一种令人难以置信的生活方式。搬来和 Jesse 在圣莫尼卡一起玩,这是个很棒的地方。
本文来源:有新Newin(ID:NewinData),原文标题:《【2.1 万字实录】Rabbit 创始人&CEO 吕骋最新对谈|R1 更像是 AI + iPod,而不是 iPhone 杀手》