Rabbit CEO 谈苹果 AI 新动作与竞争:来回切换 App 很糟糕,R1 是成本与体验的平衡,99% 创业公司会死掉!

有新Newin
基于App的操作系统正在死亡,R1设备挑战了现有的操作系统和应用程序生态,引领了一种全新的人机交互方式。

这是 Rabbit CEO Jesse Lyu 在 CES 后,与 TechCrunch 记者的最新对话。Jesse 认为,在数字时代,简化用户体验和提高效率是关键,通过 R1 设备,他不仅挑战了现有的操作系统和应用程序生态,更引领了一种全新的人机交互方式。

面对记者关于科技巨头的竞争,Jesse Lyu 表示,他从 10 年前的 Y Combinator 学到的第一课就是 99% 的创业公司会死掉,一家创业公司毫无疑问是在赌概率,而创业是一场生存游戏,最好花时间专注于自己的东西,而不是担心这个或那个......

以下是这次对话的全部内容:

为什么要制造这个设备?这是每个人都在问的那种问题,为什么不制作一款 App?我们口袋里都有强大的小工具,以及为什么现在制造?

我可能需要 18 分钟才能回答完,但我会尽量保持简短。我认为首先,基于 App 的操作系统正在死亡,这是毫无疑问的。

从用户的角度来看,确切地说是用户体验,那是思考的起点。因为我们意识到对年轻一代来说,学习如何使用不同的 App ,以及如何使用四五个不同的 App 解决一个问题并来回切换,这是多么的挑战性和困难,这就是不够直观。

我实际上 10 年前就有了这个愿景,但技术还没准备好,随着生成式 AI,尤其是 Transformer 等关键技术的重大突破,这是历史上第一次,像这样的设备实际上是可能的。

现在说到 R1 特别的,因为我们知道这是一个全新的领域,一种新的互动方式。Siri、Alexa 和谷歌这样的自然语言应用几年前就存在了,我们不认为它们做对了体验,所以我们非常谨慎。

我们想要反向思考,我们能达到用户体验的标准吗?如果我们能做到,那就降低风险。因为,很难说服人们购买额外的设备。无论如何你都会有你的手机,所以就像我之前说的,R1 是降低风险的结果。

我们想说,我们不造 1000 美元的设备,不造带订阅的 500 美元设备,我们就造一台没有订阅的 200 美元设备,我们想要这样做,降低到 100 美元或 50 美元。

感觉你随便说了一个数字,这是不是不切实际?

关于硬件,当你把所有零件组合在一起,你就有了一个 BOM 成本,所以低于这个价格就变得非常脆弱。相信我,我想给你们提供一个 5 美元的设备,但那是不可能的,硬件是设计、功能、制造质量和用户体验之间的妥协, R1 是一个非常好的平衡。

你们计划在 3 月底发货?

我们已经非常接近 10 万订单了,但美国的首批订单将在 3 月 31 日开始发货,大约在一个月后。

你们预期的是多少?

我们在主题演讲前两天,我告诉团队,如果我们能在第一天卖出 500 台就真的很好了,但我们在第一天卖出了 1.8 万台,所以我们立即增加了库存,我们不会有任何延迟,准备了 10 万台设备。

至于设计,你是 Teenage Engineering 董事会成员对么?与他们合作构建这样的东西是什么感觉?他们的音频设备和接口很出名,而设计这块有点超出他们的范围。

首先,Eeenage Engineering 是我的英雄公司,我过去 15 年收集复古合成器,自从我买了 OP1,我就成了他们的超级粉丝,所以只是为了澄清,Teenage Engineering 不是一个设计,代理机构,这家公司不是通过接设计合同来产生收入的,他们几乎完全处于他们自己的领域,那就是音频和便携式合成器。他们在这方面做得非常好,但他们很少做一些合作,我们 7 年前有过第一次合作,但与 Teenage 合作就是非常直观,我们没有电子邮件,没有 Slack,我们有一个秘密的 Instagram 帐户,在上面发布草图和渲染图,与他们合作,真的很神奇。

LAM  是整个业务的核心,我们有所耳闻。你说这在过去 1 年才成为可能,它是基于 Transformer 吗?训练数据是什么样的?

首先,  LAM  不是一个品牌,不是我们随便拼凑的一个花哨名称。我们很早就获得了 GPT API 的访问权限,距离我们第一次访问已经大约 4 年了。2019 年,我在 OpenAI 那里看到了 GPT 的第一个版本,我立即想到,如果你试图做这样的事情,有两部分,有意图,也有行动。

我之前的公司,当时我们称之为 NLP,自然语言处理,工作得很辛苦,以此解决意图,但我认为大约在 2020 年初,我确信 Transformer 将 100% 地理解你想要谈论的内容,然后我们立即尝试使用超级提示来强制这个 LLM 做事情。

结果非常糟糕。因为理论上,你可以强制 LLM 在 token 上工作,并且达到某种程度。理论上,LLM 可以做到这一点,但代价是什么?你必须字面上观看你的屏幕一步步完成这个任务,大约需要 2~3 分钟来完成这样一个任务。

我们认为这很难转化为一个好的用户体验,所以我们选择退一步,我们应该做一个专注于解决行动而不是意图的 AGI ,意图是我们所说的 LLM 和 Transformer ,当我们试图解决行动时,有几个选项:

有一种方式,你可以做的 GPT 或插件之类,通过 API 来工作,但作为一家初创公司,这显然不是最佳的前进方式。然后我们开始研究神经符号学,我们设计了一种方法,通过数据连接供应商收集真实人类在最频繁使用的 App 上的操作,我们与第三方公司合作。

回到 2020 年,我们开始要求数据收集者帮助我们收集真实人类与 Spotify、Uber、Expedia、Dora 等互动的数据,我们有 Top 800 最频繁使用的 App ,我们收集这些真实人类与不同界面互动的录音,然后我们建立了这个神经符号网络,并要求这个 AI,现在我们称之为  LAM  ,逐帧审查。

总的来说,从符号学上讲,AI 最终将足够聪明,能够使用符号方法提取所有按钮、所有元素,然后我们基本上可以构建逻辑来自动化 App 。一个好的例子,虽然不完全相似,我试图让这里不那么学术化,但如果你想到 Tesla 基于摄像头的自动驾驶,Tesla 没有雇用工程师来硬编码什么是停止标志,就容易理解了。

他们让 AI 基于数百万小时的原始行车记录仪画面进行训练。AI 最终会明白,当我看到这个,这绝对是 100% 的停止标志,一旦 AI 学会了什么是停止标志,它真的不在乎标志是在 12 街还是好莱坞大道,一个停止标志就是一个停止标志,所以  LAM  在想法上有点类似。

我们的假设是,如果这是一个音乐播放器,而音乐播放器有一个 UI,所有现代软件都有 UI。UI 是专门为人眼看到和人脑理解而设计的,以便你知道如何使用,所以真的不重要,比如 Spotify 或 Apple Music,他们改变他们的 UI,他们彻底翻新他们的所有东西。那是我们的假设。然后我们设置这个神经符号学,就像逐帧拆解真实人类在所有这些界面上做什么。这就是我们训练  LAM  的方式。

为了使其工作,最好的例子是我的助手 Tom,例如,我想订购一个比萨,怎么办?但我忙,我没有时间做,所以在我的手机上,我要先解锁我的手机,把手机递给 Tom,给了 Tom 我解锁的 iPhone 并说——“Tom,在 Doordash 上给我买一个比萨”。Tom 不需要知道我的密码,因为我授权给他了,Tom 知道如何使用 Doordash 来获取比萨,所以我所需要做的就是我和 Tom 说话,Tom 通过 Doordash 给我送来了比萨。在这种情况下,Tom 就是  LAM ,这就是想法的来源。

关于安全和隐私方面,请告诉我它的工作原理,以及它是如何保证安全的?

我们的网站上有一个完整的隐私页面,详细解释,但我实际上已经解释过了。当你得到一个设备,如果你选择不用任何第三方 App 账户登录,这默认是最好的 GPT 设备,但如果你去我们所说的 Rabbit Hole,就像一个网站。你去 Rabbit Hole,然后开始用你的 Uber 账户、你的 Spotify 账户、你的 Doordash 账户等等连接。发生的事情是,我们不保存你的凭证,因为我们不需要,也不想。

当你点击连接 Spotify 后,它会重定向你到 Spotify 登录页面,你在每个第三方系统上完成所有登录过程。Rabbit OS 会认出,这个账户已经与那个特定的 R1 连接了,你只需要做一次,所以它记得连接。

它在浏览器里?

所有的  LAM  都在云中运行,但我们不为每个用户做虚拟实例。我们有一个超级云主机,拥有超级先进的 DOM,我们实际上有一个模式运行器,基本上处理所有的流量,但就像我描述的,我把我的手机给 Tom,Tom 从 Doordash 订购了比萨,Tom 不需要知道我的信用卡信息或 iPhone 密码,我们甚至不处理支付,因为你不会在这里绑定你的信用卡信息。

当你用 Uber 登录时,你得到一辆车,在你的 Uber 设置中,你已经在他们的服务器上保存了它,并且它会通过你连接的卡进行收费。

说到信用卡,你们如何商业化?感觉像是 200 美元,没有订阅。我们还没有谈论这个,但你确实使用了第三方的 LLM,比如 Perplexity,对于你提到的意图部分,没有必要重新发明轮子,只需要通过 API 做给任何人,就感觉你在投入大量的钱,而 200 美元并不能覆盖成本。

我认为投资者在决定投资我们之前也问过同样的问题。首先,我们通过销售 R1 并没有亏钱,这对于第一代的新创业公司来说是一个非常重要的成就,我将所有的功劳归功于我的硬件团队,他们通过谈判降低了零件成本和 BOM 成本,所以我们通过销售 R1 赚钱,我们不寻求订阅模式,这通常不是一个好的方向。

我们有一个教学模式。通过使用 LAM 的教学模式,任何人都可以去那里,展示你如何在任何软件上操作,一次性教学,然后教学模式能够为你生成一个新的 Rabbit,然后你可以选择发布那个 Rabbit,就像经典的 App Store 逻辑一样,你可以出售你的创作,其他人会购买,然后我们可以从中抽取一部分,从长远来看,这绝对不是 Day1 就有的。

总的来说,我们不会因为销售更多的硬件而破产,我不担心这个。事实上,Perplexity 对我们来说不是成本,而是有益的,因为所有第一批 10 万个 R1,他们在他们的应用版本上提供了 200 美元的额度,这是他们提供给我们的免费 1 年的额度,但所有 R1 上的 Perplexity 都是免费的,是继承的。

如果你购买了 R1,你是前 10 万个订单之一,设备实际上是免费的,因为你永远获得了免费容量,你还得到了 200 美元的额度,所以我认为每个人在这里尝试做的事情真的很天才。

Tim Cook 昨天表示 Apple 今年将在 AI 方面进行突破,我怀疑是在 Siri 上加一个能操控 iPhone 应用和其他东西的 LAM,否则,我不知道他们为什么还要费心制作一个模型,你觉得被这些巨头威胁了吗?

首先,我们是一家创业公司,我从 10 年前的 Y Combinator 学到的第一课就是 99% 的创业公司会死掉,这是我学到的第一课。所以,作为一家创业公司,你是在赌概率,毫无疑问。

其次,我不在乎,他们会做他们要做的,我会做我要做的。如果你作为一个企业家的心态是,我有一个天才的想法,我可以保证这能运转起来,无论所有这些大科技公司尝试什么,这只是基本的。一个更好的想法?那你是在做梦,没有这样的事情。

现实是,创业是一场生存游戏,你最好花时间专注于你自己的东西,而不是担心这个那个。一些创始人听说 Apple 正在做 Apple Car 就停下来了,现在这些人怎么样?我认为有这种竞争水平很好,它只会帮助我们更快成长或更快失败,这是创业公司的本质,但是是哪种情况?我还不知道,我会尽力而为,就像我说的,这是一场生存游戏。

来源:有新Newin,原文标题:《Rabbit CEO 谈苹果 AI 新动作与竞争:来回切换 App 很糟糕,R1 是成本与体验的平衡,99% 创业公司会死掉!》

风险提示及免责条款
市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。