Sam Altman,曾经的Y Combinator掌门人,如今的OpenAI CEO,在最新的访谈中毫不掩饰地表达了他对公司现状的“震惊”。他坦言,自己最初只想打造一个AGI研究实验室,却“意外”地卷入了消费互联网的浪潮。
3月20日,Sam Altman做客知名科技商业撰稿人Ben Thompson旗下播客的创始人系列节目,详细阐述了OpenAI的诞生故事、和微软的合作进展、ChatGPT的起源、GPT-5的进度等。
播客中,Altman还就AI商业化、开源模型、API驱动的业务等热门议题发表了自己的观点。
Ben Thompson是科技领域最具洞察力的分析师之一,他的博客网站Stratechery以其对科技行业的深度分析和前瞻性预测而闻名,被誉为“科技博客的标杆”,备受硅谷企业家推崇。
据悉,风投公司Homebrew的合伙人Hunter Walk和TechCrunch的创始人Mike Arrington都订阅了Stratechery。
播客核心要点如下:
- 如果用GPT 4开启“ChatGPT时刻”,那将是一个超级、超级病毒式的时刻。
- 从用户规模来看,OpenAI已经成为Facebook之后最大规模的公司。
- 五年后,拥有10亿活跃用户的网站要比最先进的模型更有价值。
- 未来要在AI行业构筑战略优势,一是要建立互联网公司,构筑产品套件的“生态圈”;二是要实现最便宜、最丰富的推理堆栈,三是要进行最好的研究、打造最好的模型。
- OpenAI未来不会成为“操作系统平台”,而是类似于谷歌,通过用户账户和数据的携带,以及强大的产品套件,成为一个拥有数十亿用户的平台。
- 比起通过广告模式变现,Altman更希望能够通过完全代理的收费模式来实现商业化。比如:用户通过Deep Research购买到了想要的商品,OpenAI将收取2%的会员费或其他费用。
- DeepSeek爆火的原因不在于模型本身,而在于免费提供模型,同时公开了思维链。
- 从方向上来说,未来OpenAI也会考虑免费提供所有模型。
- 随着AI技术的介入,代码编写工作的自动化进度已经超过50%,距离实现完全代理还存在模型能力的差距。
- AI对人类社会的冲击可能和IT时代不同,不遵循“人类工作被取代-自上而下的变革”的路径,更可能是不断渗透经济,以越来越快的速度“吞噬一切”。
以下为对谈全文,由AI翻译整理:
主持人:Sam Altman,欢迎来到Stratechery。
SA:谢谢邀请我。
主持人:你之前来过一次,那次是和Kevin Scott一起接受采访,而且我认为你当时是在车里。
SA:是的,没错。
主持人:是的,我没有机会问我通常会问第一次接受采访的人的问题,也就是背景。你是在哪里长大的?你又是怎么开始接触科技的?给我讲讲Sam Altman的发家史。
SA:我在圣路易斯长大。我出生在芝加哥,但我确实是在圣路易斯长大的。我住在郊区,那是一个安静而美丽的地方,有古老的林荫街道。我还是个电脑迷。我小学里有一些电脑,我认为它们很棒,我会花尽可能多的时间来操作它们。
那是在计算的辉煌时期,你可以立即在电脑上做任何你想做的事情,而且很容易学会编程,这简直是疯狂的有趣和令人兴奋。后来,我的父母给我买了一台电脑,或者说给我们买了一台电脑,我一直是个疯狂的极客,彻头彻尾的那种,喜欢科学、数学、电脑和科幻小说等等。
主持人:嗯,在很短的时间里,你就去了斯坦福,19岁的时候创办了Loopt,七年后被收购。我认为这样描述是公平的,这是一个失败的初创公司——七年已经算不错了,但那是一次收购。这怎么会让你在Y Combinator工作,最终很快就执掌了这家公司?
SA:我们是最早一批获得Y Combinator资助的公司之一,我既感激不尽,又认为这是最酷的事情,这是一个很棒的社区,我仍然认为 YC 对科技行业的影响被低估了,即使人们认为它已经产生了巨大的影响。所以这对我和这个行业来说都是一件非常重要的事情,我想提供帮助。所以在创办这家初创公司的时候,我经常在YC附近转悠。
主持人:从某种程度上来说,这实际上是为在 YC 工作准备了七年。你可能当时没有意识到这一点。
SA:在某种程度上是这样。虽然不是有意为之,但我很多朋友都在YC,我们的办公室离YC办公室很近,所以我经常去那里,我会花很多时间跟PG [Paul Graham] 和 Jessica [Livingston] 聊天,后来我们的公司被收购了,PG说,也许你应该来YC看看。
我最初真的不想那样做,因为我不想成为一个投资者——我显然对这家初创公司的发展不满意,我想创办一家好公司,我不认为自己是一个投资者,我为自己不是一个投资者而感到自豪。我做过一点点投资,在我看来这不像我想要关注的重点,我很高兴把它当成兼职来做。这有点意思,但我不想说我不尊重投资者,但我不尊重我自己作为投资者的身份。
主持人:是否存在这样的情况,PG既是投资者又是创始人,因为他创立了YC,而且通过接管YC,这是一个非常酷的职位,但你也不是创始人?
SA:我真的不在乎是否是创始人,我只想找一份运营方面的工作,他最终对我说的话很有说服力,或者说结果证明很有说服力,他说,“如果你管理YC,这比当投资者更像是在运营一家公司”,事实证明确实如此。
主持人:我稍后会再谈到这一点,但我确实想再展开讲讲。我想你在2014年开始管理 YC,大约在那个时候或2015 年,你和Elon Musk在罗斯伍德酒店共进晚餐,谈论人工智能。是什么促成了那次晚餐?当时是什么情况?这只是一个提议还是有预谋的?
SA:是人工智能刚刚出现那会儿吗?
主持人:是的,那次晚餐是,“我们来聊聊人工智能吧”?
SA:是的,那确实是一次关于人工智能的晚餐。我想,出于某种原因,那次晚餐,那一个特定的时刻被永远神化了,但那一年有很多晚餐,尤其是在那个夏天,包括很多次和Elon的晚餐。但那是一次有很多人的聚会,出于某种原因,这个故事被广泛传播。但是,是的,那次晚餐的主要目的是讨论人工智能。
主持人:在OpenAI成立后的这些年里,人们给它附加了很多动机,比如安全、人类的福祉、非营利、开放性等等。显然,OpenAI 在某些问题上的立场已经发生了变化。但是,当我回顾这段历史时,实际上我认为这在这次谈话的最初几分钟就得到了加强,我看到一个雄心勃勃的年轻人,他把自己放在一个可以创造变革性技术的位置上,即使为此付出了在硅谷拥有最令人羡慕的席位的代价。
我的意思是,这仅仅是你接管Y Combinator后的一年。从个人层面来说,你创办OpenAI的动机是什么?Sam Altman 的理由。
SA:在那之前,我相信,我当时相信,现在也相信,如果我们能弄清楚如何构建 AGI,以及如何让它成为世界上最纯净美好的力量,这将是任何人都能做的最令人兴奋、最有趣、最有影响力和最积极的事情之一。
主持人:满足所有那些尚未满足的需求。
SA:是的。但就像,我不知道。它比我所希望的更好,但它一直是研究过的最有趣、最令人惊叹、最酷的事情。
主持人:你是否立刻感受到了这种紧张感,“哦,我只是把它当成一个副业?”在什么时候它变成了主要的事情,而YC变成了副业?
SA:我想用YC做的事情之一是,YC在当时是如此强大,我们可以用它来推动更多的人去做硬科技公司,我们可以用它来促成更多的研究发生,我一直对这个很感兴趣。这是我 YC尝试做的第一件大事,也就是,“我们要开始资助传统的硬科技公司,我们也要尝试帮助启动其他硬科技项目”,所以我们开始资助超音速飞机、聚变和裂变、合成生物公司等等,我真的想找到一些AGI项目来资助。
当时实际上只有一两个项目,我们确实和他们谈过,然后就有了DeepMind这个大项目。我一直对人工智能很感兴趣,我在本科时就在人工智能实验室工作,当时什么也做不出来,但我一直认为这是最酷的事情,显然 OpenAI 的结构和计划有好有坏,但我们的总体使命是,我们希望构建有益的、广泛分布的AGI,这始终如一,我仍然认为这是一个非常重要的使命。
所以这似乎 YC应该支持的事情,我们一直在考虑资助更多的研究项目。我认为已经被历史的尘埃掩埋的一件事是,当我们创办OpenAI 时,它是一个研究实验室,没有任何想法,甚至没有任何想法的雏形。
主持人:变形金刚甚至还没有出现。
SA:它们甚至不存在。我们当时正在制作像 RL [强化学习] 代理来玩电子游戏之类的东西。
主持人:对,我正要提到电子游戏这个点。没错,那就像你的第一个版本。
SA:所以我们没有任何业务模式或业务模式的想法,事实上,在那时,我们甚至没有真正意识到计算机会变得多么昂贵,所以我们认为也许我们可以成为一个研究实验室。但是,在那些早期的岁月里,我们就像一个迷失在荒野中,试图弄清楚该做什么的学术研究实验室,然后只是解决摆在我们面前的每一个问题,不仅是研究问题,还有“我们的结构应该是什么?”、“我们怎么赚钱?”、“我们需要多少钱?”、“我们怎么建立算力?”,我们不得不做很多事情。
主持人:这感觉就像你从大学辍学去创办Loopt,然后你说,“你知道吗?大学的聚会体验非常好,所以我要去 YC 混混”,然后感 OpenAI 就像,“你知道吗,只是做学术研究和发现很酷的事情也很好”,这就像你自己重建了大学,因为你错过了。
SA:我想我偶然发现了更好的东西。我当时确实喜欢大学,我不是那种超级反大学的人,也许我现在已经在这个方向上变得更加激进,但我也认为20年前会更好。但更像是,“哦,哇,YC 社区一直是我想象中的完美的学术社区”,所以至少我觉得我没有试图重建什么。更像是,“哦,我找到了这个更好的东西”。
总之,对于 OpenAI,我逐渐越来越投入,它最初只是YC的六个研究项目之一,也是我花时间关注的数百家公司之一,然后它就这样发展起来了,我开始痴迷。
主持人:从很多方面来说,你的时间线预测了整个实体的时间线。
SA:是的。
主持人:也许对OpenAI来说最重要的一年——嗯,我的意思是这里会有很多重要的一年——但从商业策略极客的角度来看,也就是我在互联网上的领域——是2019年,我认为。
2019年,你发布了 GPT-2。你没有立即开源该模型,你创建了一个营利性结构,从微软那里融资。从某种意义上说,这两者都违反了最初的OpenAI 愿景,但我认为,因为我正在和你交谈,而不是像整个 OpenAI,看不出这些与你的愿景有任何不兼容之处,它们只是实现这个了不起的事情所需要做的事情。这种说法公平吗?
SA:首先,我认为它们非常不同。就像GPT-2的发布,有一些人只是非常担心,你知道,也许这个模型是完全安全的,但我们不知道我们想获得——我们确实拥有这个新的、强大的东西,我们希望社会与我们一起发展。
现在回想起来,我完全后悔我们使用的一些语言,我理解为什么人们会说,“啊,这就像炒作和危言耸听等等”,这真的不是本意。做出这些决定的人,我认为他们当时有很好的意图,但现在我可以看到它是如何被误解的。
筹款——是的,那一次就像,“嘿,事实证明我们真的需要扩大规模,我们已经发现了扩展定律,你知道,我们必须找到一种能够让我们做到这一点的方式”。但我很好奇,作为一个商业策略极客,我们做得怎么样?
主持人:我们稍后会谈到这个问题,我对其中一些背景问题非常感兴趣。再简单提一下非营利组织——这个故事,你谈到了神话。神话是这样的,你提出了利他主义的原因,这也是对抗谷歌的一种方式。就这些了吗?
SA:为什么要成为非营利组织?
主持人:是的。为什么要成为非营利组织,以及随之而来的所有问题?
SA:因为我们认为我们将成为一个研究实验室。我们真的不知道我们是否会成为一家公司。我们的计划是发表研究论文。但没有产品,没有产品的计划,没有收入,没有业务模式,也没有这些计划。生活中一直对我有用的事情就是,在黑暗中摸索前进,直到找到光明,我们在黑暗中摸索了很长时间,然后我们找到了有效的方法。
主持人:对。但这东西现在不是像一个磨石一样压在公司的脖子上吗?如果你可以重来一次,你会怎么做?
SA:是的。如果我了解了现在知道的一切,当然会。当然我们会用不同的方式来设立它,但我们并不知道现在知道的一切,我认为站在创新前沿的代价是,你会犯很多愚蠢的错误,因为你身处战争的迷雾之中。
ChatGPT的起源故事
主持人:给我讲讲ChatGPT的故事?这是谁的主意?最初的几天和几周是怎样的?我们之前在线下谈过,你表示这简直是一个巨大的冲击。我的意思是,这还是这个故事吗?
SA:这确实是一个冲击。就像看看,显然我们认为有一天人工智能产品会变得非常巨大。所以为了设定背景,我们在API中推出了 GPT-3,在那时我们知道我们需要成为一家公司并提供产品,GPT-3运行良好。它没有做得很好,但还不错。它在一个类别中找到了真正的产品市场契合点。现在说起来这听起来很可笑,但它只是一个文案写作,人们能够使用GPT-3 API建立真正的业务。
然后,对于3.5和4,很多人可以用它来做很多事情,但这就像在黑暗时代,除了这一点,人们用它做的事情是开发者。我们有一个叫做The Playground的东西,你可以在上面测试模型,开发者们试图与模型聊天,他们觉得这很有趣。他们会和它谈论他们将用来做什么,以及人们现在使用它的这些初步方式,我们想,“好吧,这有点意思,也许我们可以让它变得更好”,并且在未来对产品做出了模糊的姿态,但我们知道我们想构建某种——我们一直在考虑聊天机器人很长时间了。甚至在API之前,我们就讨论过将聊天机器人作为要构建的东西,我们只是认为这个模型还不够好。
因此,用户有明确的需求,我们在RLHF方面也变得更好了,我们认为我们可以调整模型以使其更好,然后我们有了一件当时没人知道的事情,也就是GPT-4,GPT-4真的很好。在一个外部世界已经习惯了GPT-3,或者3.5已经发布了的世界里,我不记得了,我想在我们推出ChatGPT的时候——是,但不是 4。我们认为,“这会真的很好”。
我们已经决定要构建这款聊天产品,我们在那一年的8月完成了GPT-4的训练,我们知道我们手上有这个奇迹,最初的计划是推出ChatGPT,好吧,推出一个带有GPT-4的聊天机器人产品,因为我们都已经习惯了GPT-4,我们不再认为3.5很好,而且我们非常担心,如果我们推出带有3.5的东西,没有人会关心,人们不会留下深刻印象。
但也有一些人,我就是其中之一,开始思考,“伙计,如果我们同时推出GPT-4和聊天界面,那将是,那基本上就是图灵测试的通行证”。虽然不是字面上的,但如果人们没有看到它,就会有这样的感觉。所以,我们把它分开,我们发布一个带有3.5的聊天界面和聊天调整模型的预览版,一些人想这样做,但大多数人不想,大多数人认为它不会很好。
所以最后我只是说,“让我们这样做”,然后在那个时候,我们仍然认为我们将在1月份推出 GPT-4,所以我们想,“好吧,如果我们要做这件事,让我们在假期之前把它发布出来”,所以如果有人被分配到这项任务等等。我们决定这样做,我想是在感恩节之后不久。
主持人:是的,那是 11 月底。我不记得是在之前还是之后,但就在那个时候,是的。
SA:我想是在之后,因为我出去度假了还是什么的,然后我回来了,他们准备好了,“我们将在第二天发布”,或者今天还是什么,“我们要把它叫做ChatGPT 3.5”,我说,“绝对不行”。我们很快就做出了关于“ChatGPT”的即时决定,并且在当天或第二天发布了它。很多人认为它会彻底失败,我认为它会做得很好,显然没有人认为它会像它那样做得那么好,然后它就变得很疯狂。我认为这很棒。
主持人:从扩展的角度来说,你是否认为,大家之所以继续用3.5,仅仅因为它更便宜?
SA:是的,但可能不是你所想的那种方式。它从扩展的角度拯救了我们,因为如果我们,只是保持实际的系统和工程的正常运行是疯狂的。这已经是一个非常病毒式的时刻了,如果我们用4启动ChatGPT,那将是一个超级、超级病毒式的时刻。
我在硅谷见过的最疯狂的事情之一是,在六个月的时间里,我们从基本上不是一家公司变成了一家大公司。我们不得不建立企业基础设施,所有人以及为之服务的一切,那是一段疯狂的时期,而且因为这个模型比 4 更差,需求量稍稍减少,结果证明,这真的很重要。
主持人:但从长远来看,这对你来说有害吗?因为有些人当时尝试了它,而且他们从未更新过他们的先验知识。我的意思是,你快进到DeepSeek,它就像,“哇,这个好多了”,就像,“嗯,是的,因为你没有使用后续的模型”。
SA:我认为很难说我们受到了太大的伤害,我们现在做得很好。
主持人:你做得很好。
SA:是的,但你的观点很好,也就是如果你想想那个模型有多尴尬,那个模型几乎无法连贯,而现在我们有这些东西,它们正在取代谷歌对于很多连接到互联网的人,非常聪明,写完整的程序。在过去两年零四个月的时间里取得了令人难以置信的进步。
主持人:我在开头提到的与您和凯文·斯科特 (Kevin Scott) 进行的第一次采访是为了纪念新Bing的发布,就在几个月后,我相信那是GPT-4首次推出的时候。
SA:是的。
主持人:你非常兴高采烈。在通话中,你对一家搜索巨头说了一些强硬的话,他们不应该感到太高兴。当时您是否意识到,可能颠覆谷歌搜索的公司实际上可能是您 ,而不是微软?
SA:是的,我认为我对此有所希望。
主持人:OpenAI 发生了很多戏剧性的事情,至少可以这么说,这可能会影响你与微软的关系,我知道你对微软只有好话要说,所以我不会在这方面追问你,但是否有一种感觉是,当你回到2019年与他们建立这种合作关系时,没有人会想象到像ChatGPT这样的东西,这意味着你们都是面向最终用户的实体,也许这只是不可避免地会成为一个真正的问题?
SA:是的,我的意思是,没有人认为我们会在当时成为一家大型的消费类公司。这是真的。
主持人:是的,我的意思是,对我来说,这是解开很多OpenAI问题的黄金钥匙。我记得回到过去,Nat Friedman和Daniel Gross,我和我在2022年10月开始了这个人工智能采访系列,在ChatGPT推出前一个月,我们的重点是,没有人了解这种人工智能的东西,人们需要构建产品。然后一个月后,产品发布,人们抱怨聊天机器人。但你看看任何一个青少年,看看人们如何互动,他们一直在发短信。
SA:这实际上是我对为什么要这样做的一些见解。这是年轻人主要做的事情。
主持人:你在内部遭遇了双重打击。人们过分依赖好的模型,没有意识到坏的模型有多么让人们震惊,而且你有一群不喜欢发短信的婴儿潮一代。
SA:OpenAI 的婴儿潮一代不多。
主持人:在口语中是婴儿潮一代,而不是真正的婴儿潮一代。
SA:是的,我会说我可能不如OpenAI员工那么成熟。
主持人:我确实要代表我的Sharp Tech联合主持人Andrew Sharp问一下,所有的小写字母,那是因为AI使用所有小写字母,还是仅仅是一种习惯?
SA:不,我只是一个互联网小子,在人工智能出现之前我也没有使用大写字母。
主持人:是的,你看我只是X世代的最后一年,却嘲笑那些千禧一代,这太糟糕了。
一家消费类科技公司
主持人:到目前为止,我还想跟你谈谈关于ChatGPT的一些理论, 没有人想到你们会成为一家消费科技公司 。这一直是我的论点:你们是一家研究实验室,当然,我们会推出 API,也许会赚一些钱,但你提到了六个月的扩张期,必须抓住这个基本上摆在你面前的机会。科技界有很多关于员工流失和一些名人离职的讨论,以及类似的事情,在我看来,没有人签约成为一家消费品公司。如果他们想在Facebook工作,他们就可以在 Facebook 工作。
这也是另一个核心矛盾,无论你是否愿意,你都有这个机会,这意味着它与最初的样子截然不同。
SA: 听着,我没有资格抱怨,对吧?我得到了科技界最好的工作,如果我开始抱怨这并不是我想要的,以及对我来说是多么不幸等等,那就太不通情达理了。
但是,我想要的是去运营一个AGI研究实验室,弄清楚如何制造 AGI。我不认为我签约了要运营一家大型的消费类互联网公司。我从我之前的工作中知道了,我认为那也是当时科技界最好的工作,所以我想我两次都很幸运,我知道它会占据你的生活多少,在某些方面运行这些大型的消费类公司有多么困难。
但我知道该怎么做,因为我已经指导了很多人,并且观察了很多。当我们推出ChatGPT时,每天都会有用户涌入,这会搞垮我们的服务器。然后夜晚到来,它会下降,每个人都说,“结束了,那只是一个病毒式的时刻”,然后第二天峰值会更高,下降,“结束了”。第二天峰值会更高,到第五天的时候,我说,“哦,伙计,我知道这里会发生什么,我见过很多次这种电影了”。
主持人:但是,你见过很多次这种电影吗?因为游戏的整个名称就是关于客户获取的,所以对于很多初创公司来说,这才是真正的挑战。实际上,能有机地、病毒式地解决客户获取的公司其实非常少。我的意思是,我认为在这一类别中,真正领先于OpenAI的公司是 Facebook,它是在2000年代中期。我认为你高估了你之前可能见过多少。
SA:好的。在这个规模上,是的,我们可能是最大的。我想我们是自Facebook以来成立的最大公司。
主持人:如此规模的消费类科技公司实际上是令人震惊的罕见,这种情况不会经常发生。
SA:是的。但我见过 Reddit、Airbnb、Dropbox、Stripe 和许多其他公司,它们恰好实现了这种疯狂的产品市场契合和失控的增长,所以也许我还没有见过任何这种规模的东西。当时你不知道它会是什么,但我已经看到了其他人身上的这种早期模式。
主持人:你告诉人们这件事要发生了吗?或者这是你无法沟通的事情?
SA:我说了,不,我把公司召集在一起,我说,“这将非常疯狂,我们有很多工作要做,而且我们必须非常快地完成这些工作,但这是一种疯狂的机会,它落入了我们的生活,我们要去做这件事,这就是它会是什么样子”。
主持人:有人理解你或相信你吗?
SA:我记得有一天晚上我回家了,把头放在手里,就像这样,我说,“伙计,该死的, Oli [Oliver Mulherin],这真的糟透了”。他就像,“我不明白,这看起来真的很棒”,我说,“这真的很糟糕,对你来说也很糟糕,你只是还不知道,但这就是会发生的事情”。但没有,我想没有人,这是我之前经历过的古怪经历,我可以在早期就认识到它,而且没有人能感受到它在最初的几周里会变得多么疯狂。
主持人:五年后什么会更有价值?一个每天有10亿活跃用户的目的地网站,而且不必进行客户获取,还是最先进的模型?
SA:我想是那个10亿用户的网站。
主持人:这种情况是否成立,或者是否因为似乎,至少在GPT-4级别上,我的意思是,我不知道你是否看到了今天LG刚刚发布了一个新模型。会有很多,我不知道,不评论它有多好或不好,但是有很多最先进的模型。
SA:我最喜欢的历史类比是晶体管,它代表着通用人工智能的未来。晶体管将会大量存在,它将渗透到一切事物中,它将变得便宜,它是一种新兴的物理学特性,它本身不会成为差异化因素。
主持人:什么会成为差异化因素?
SA:我认为存在战略优势的地方,是建立这家巨大的互联网公司。我认为这应该结合几种不同的关键服务。ChatGPT大概有三到四种服务,你会想要购买所有这些服务的捆绑订阅。你将希望能够用你的个人AI登录到其他服务,它已经通过你的生活,你的岁月了解了你,并在那里使用它。我认为将会有令人惊叹的新型设备,它们针对你如何使用AGI进行了优化。将会有新型的网络浏览器,将会有整个集群,有人只是会围绕AI建立有价值的产品。所以这是一方面。
还有另一方面,也就是推理堆栈,也就是你如何实现最便宜、最丰富的推理。芯片、数据中心、能源,将会有一些有趣的金融工程要做,所有这些。
然后第三件是,实际上要进行最好的研究、打造最好的模型。我认为这是价值的三位一体,但是大多数模型,除了最前沿的模型,我认为会很快商品化。
主持人:所以当Satya Nadella说模型正在被商品化时,OpenAI是一家产品公司,这仍然是一个友好的声明,我们仍然是同一团队的吗?
SA:是的,我不知道这对于大多数听众来说是否听起来像是一种赞美,我认为他的意思是那是对我们的恭维。
主持人:我的意思是,我就是这样理解的。你问我对这个战略的解读,我在ChatGPT发布后很早就写过,说这是一家意外的消费类科技公司。
SA:我记得你写过那个,是的。
主持人:就像我说的,这是科技界最罕见的机会。我想我从对Facebook的战略写作中获得了很大的优势,因为它是一个如此罕见的实体,而且我依附于,“不,你不知道它会走向何方”,但我直到2013年才开始,我错过了开端。我已经做了12年的 Stratechery,我觉得这是我能够从一开始就涵盖的、达到这种规模的第一家公司。
SA:这种情况不会经常发生。
主持人:确实不会。但是,就这一点而言,你刚刚发布了一个大型的API更新,包括访问为Operator提供支持的相同计算机使用模型,这是GPT Pro的一个卖点。你还发布了响应API,而且我认为关于响应API最有趣的部分是,你说,“看,我们认为这比聊天完成API好得多,当然我们会维护它,因为很多人都是基于它构建的”。它已经成为行业标准,每个人都复制了你的API。在什么时候,这种API工作和必须维护旧的API,并将你的功能推送到新的API变成了干扰和资源的浪费,而你面前有一个Facebook级别的机会?
SA:我真的相信我刚才说的这个产品套件。我认为,如果我们执行得很好,五年后,我们将拥有一系列数十亿用户的产品,为数不多,然后我们有这样的想法,你用你的OpenAI帐户登录到任何想要集成 API 的其他人,你可以带着你的积分捆绑和你的自定义模型以及其他一切到任何你想去的地方。我认为这是我们真正成为一个伟大平台的一个关键部分。
主持人:好吧,但这是Facebook遇到的矛盾。用我的术语来说,既要成为平台又要成为聚合器是很困难的。我认为移动技术对Facebook来说很好,因为它迫使他们放弃了成为平台的虚荣心。你不能成为一个平台,你必须接受成为一个带有广告的内容网络。而广告只是更多的内容,它实际上迫使他们进入了更好的战略地位。
SA:我不认为我们会成为像操作系统那样的平台。但我认为,就像谷歌不是一个真正的平台,但人们使用使用谷歌登录,人们在网络上带着他们的谷歌东西,这是谷歌体验的一部分,我认为我们会以这种方式成为一个平台。
主持人:携带登录,就是携带你的记忆和你自己,你的偏好和所有类似的东西。
SA:是的。
主持人:那么,您是打算凌驾于所有人之上吗?他们能够进行多次登录吗?OpenAI的登录会更好,因为它附带了您的记忆功能?或者,如果他们想使用我们的API,就必须使用我们的登录方式?
SA:不,不,不。当然,这是可选的。
主持人:当您面前有如此巨大的机会时,您不认为这会分散注意力或造成资源的分裂吗?
SA:我们确实需要同时做很多事情,这在很多方面来说都是困难的部分,我认为,是的,我认为OpenAI最具挑战性的事情之一是我们必须很好地执行很多事情。
主持人:嗯,这是选择的悖论。在您这个位置上,可以做的事情太多了。
SA:我们并没有做很多事情,我们几乎对所有事情都说了不。但即便如此,如果您只是考虑核心的事情,我认为我们确实必须做,我不认为我们只做一件事就能成功。
关于广告
主持人:从我的角度来看,当您谈论服务数十亿用户并成为一家消费技术公司时,这意味着广告。您不同意吗?
SA:我希望不是。我不反对。如果有充分的理由这样做,我对此并不教条。但我们有一个很棒的订阅销售业务。
主持人:要实现盈利并收回所有投资,还有很长的路要走。而广告的好处在于,它可以扩大目标市场的广度和深度,因为您可以增加每个用户的收入,并且广告商承担了费用。您不会遇到任何价格弹性问题,人们只会更多地使用它。
SA:目前,我更兴奋的是弄清楚我们如何能够为一个真正优秀的自动化软件工程师或其他类型的代理收取大量费用,而不是用基于广告的模式赚取一些钱。
主持人:我知道,但大多数人并不理性。他们不会为生产力软件付费。
SA:让我们拭目以待。
主持人:我为ChatGPT Pro付费,我可能不是一个合适的谈话对象,但我只是……
SA:您认为您从中获得了良好的价值吗?
主持人:当然,我认为……
SA:太好了。
主持人:——尤其是Deep Research,它太棒了。但我可能对人们是否愿意花钱购买某些东西持怀疑态度,即使算术题很明显,即使它能让他们提高生产力。与此同时,我看到您在谈论构建记忆。谷歌广告模式之所以如此出色,部分原因是他们实际上不需要了解用户太多,因为人们在搜索栏中输入了他们要搜索的内容。人们在您的聊天机器人中输入了大量的内容。即使您提供的广告再愚蠢,并且即使您无法跟踪转化,您的定位能力也将是世界一流的。
而且,顺便说一句,您没有现有的商业模式需要担心被削弱。我的感觉是,这与OpenAI的每个人所签约的内容背道而驰,这是最大的障碍。但对我来说,从一个商业分析师的角度来看,这似乎是非常明显的,而且您已经落后了。
SA:我更愿意尝试的,比传统广告更让我兴奋的是,很多人使用Deep Research进行电子商务,例如,我们能否想出一种新模式,即我们永远不会花钱改变展示位置或其他什么,但如果您通过Deep Research购买了您找到的商品,我们将收取2%的会员费或其他费用。这会很酷,我对此没有异议。也许我们可以用一种有品位的方式来做广告,但我不知道。我就是不太喜欢广告。
主持人:这总是症结所在。马克·扎克伯格也不太喜欢广告,但他还是找到了人来做这件事,并且“不要告诉我”。神奇地赚钱。
SA:是的。再说一次,我喜欢我们当前的商业模式。我不会说我们将会做什么和永远不会做什么,因为我不知道,但我认为有很多有趣的、比现在广告更靠前的变现策略。
关于竞争
主持人:您是否认为, DeepSeek 出现并引起轰动,人们可以访问并看到了这种推理时,部分原因是使用ChatGPT的人对此印象不深,因为他们使用过o1 ,他们知道什么是可能的。
SA:是的。
主持人:但不是免费用户,也不是那些只试用一次的人。这是否实际上是您的沉默让其他产品看起来更令人印象深刻的地方?
SA:完全正确。我认为DeepSeek——他们组成了一支很棒的团队,他们制作了一个很棒的模型,但模型的强大功能,但我认为模型能力并不是真正让他们爆红的因素。这对我们来说是一个教训,即当我们隐藏一个功能时,我们隐藏了思维链,我们有充分的理由这样做,但这确实意味着我们为其他人留下了爆红的空间。
我认为从这个意义上说,这是一个很好的警钟。而且,我不知道,这让我真的开始以不同的方式思考我们放在免费套餐中的东西,现在免费套餐将获得GPT-5,这很酷。
主持人:哦,ChatGPT-5的提示。稍后我将询问您更多关于它的信息。
当您考虑您的商业模式时,我回到的一个问题是,您的商业模式对高级代理人员来说很棒,这些人会使用ChatGPT,并且会为它付费,因为他们看到了价值。但有多少人是高级代理?
此外,高级代理会尝试所有其他模型,因此您将不得不保持相当高的标准。而不是,我有一个好模型,它有效,它就在那里,我不需要付费。它不断变得更好,人们从中赚取了更多的钱,但我不知道,因为我对广告很满意,而大多数互联网用户都是如此。
SA:再说一次,对我们需要做的任何事情都持开放态度,但我对我所建议的商业例子这样的事情比传统的广告更感兴趣。
关于竞争对手
主持人:当DeepSeek出现时,您是否觉得为什么人们开始不为美国公司欢呼了?您是否觉得DeepSeek的一些兴奋情绪也带有一些反OpenAI的情绪?
SA:我没有。也许是这样,但我当然没有这种感觉,我认为有两个原因。一个是他们将一个前沿模型放在免费层级中。另一个是他们展示了思维链,这有点令人着迷。
主持人:人们会说,“哦,它太可爱了。人工智能试图帮助我。”
SA:是的。我认为主要就是这两件事。
主持人:在您最近关于人工智能行动计划的提议中,OpenAI表达了对公司基于DeepSeek模型构建的担忧,这些模型在其中一个短语中是“免费提供的”。如果这确实是一个问题,那么解决方案难道不是让你们的模型免费提供吗?
SA:是的,我认为我们应该这样做。
主持人:所以当……
SA:我没有发布公告,但从方向上来说,我认为我们应该这样做。
主持人:您之前说过,十亿用户量的目的地网站比模型更有价值。这是否应该贯穿您的发布策略以及您对开源的看法?
SA:敬请期待。
主持人:好的,我将拭目以待。够了。
SA:我没有抢先发布,但请拭目以待。
主持人:我猜这个问题的后续是,这是否是一个真正回到您最初使命的机会?如果您回过头来看最初的声明,DeepSeek和Llama……
SA:本,我正在努力给您尽可能多的暗示,而不会直接说出来。拜托。
(笑声)
主持人:好的,好吧。够了。够了。这是否是一种解脱的感觉?对吧?您回想起GPT-2的公告以及对安全性的担忧等等。在这一点上,这似乎很古怪。是否有一种感觉,猫已经从袋子里跑出来了?在这一点上,对这些发布保持谨慎有什么意义?
SA:我仍然认为未来可能存在巨大的风险。我认为我们过去过于保守是公平的。我也认为说我们保守是公平的,但当您一无所知时,保持一点保守的原则并不是一件可怕的事情。我也认为,在这一点上,这将扩散到各处,无论是我们的模型做了坏事,还是其他人的模型做了坏事,谁在乎呢?但我不知道,我仍然希望我们成为尽可能负责任的行动者。
关于其他竞争对手
主持人:另一个最近的竞争对手是Grok。我将从我的角度来说,在过去的一年左右的时间里,我有了两种,我认为是有趣的心理体验。
首先是在我的Mac上运行本地模型。由于某种原因,我非常清楚它在我的Mac上,它没有在其他任何地方运行,这实际上是一种非常棒的感觉。然后第二件事是Grok,我觉得我不会在随机的时间点被训斥。而且,为了感谢您,ChatGPT在这方面已经变得越来越好了。但是Grok是否让您觉得实际上,是的,我们可以更进一步,让用户成为成年人?
SA:实际上,我认为我们变得更好了。我认为我们一段时间前在这方面真的很糟糕,但我想我们在这方面已经做得更好了。
主持人:我同意。它确实变得更好了。
SA:长期以来,这是我对我们的产品最感兴趣的事情之一。现在我有点喜欢它,它不会困扰我作为用户,我认为我们处于一个很好的位置。所以我以前经常考虑这个问题,但在过去的六到九个月里,我没有考虑过这个问题。
关于幻觉和监管
主持人:幻觉有没有不好的地方?您发布了一个写作模型的样本,这与我长期以来的观点联系在一起,即每个人都在非常努力地使这些概率模型表现得像确定性计算,并且几乎忽略了其中的魔力,这就是他们实际上正在编造东西。这实际上非常不可思议。
SA:百分之百。如果您想要确定性的东西,您应该使用数据库。这里很酷的事情是它可以具有创造性,有时它不会创建您想要的东西。没关系,您再点击一次。
主持人:这是一个人工智能实验室的问题,他们试图这样做吗?还是一个用户期望的问题?我们如何让每个人都喜欢幻觉?
SA:嗯,您希望它在您想要的时候产生幻觉,在您不想要的时候不产生幻觉。如果您问,“告诉我关于科学的这个事实”,您希望它不是一个幻觉。如果您说,“为我写一个有创意的故事”,您想要一些幻觉。我认为问题,有趣的问题是,您如何让模型只在对用户有利的情况下产生幻觉?
主持人:您认为当这些提示被泄露时会产生多大的问题,它们会说类似“不要透露这个”或“不要说这个”或“不要做X,Y,Z”之类的话。如果我们担心安全性和对齐,那么教人工智能撒谎不是一个很大的问题吗?
SA:是的。我记得当xAI真的被嘲笑时,因为在系统提示中,它说了关于不要说关于埃隆·马斯克的坏话或其他之类的话。这让他们很尴尬,但我感到有点难过,因为模型只是试图遵循给它的指令。
主持人:对。它非常认真。
SA:非常认真。是的。所以是的,这是一个愚蠢的事情,当然很尴尬,当然,但我认为它并没有被认为是崩溃。
主持人:我认为一些怀疑论者,包括我在内,你呼吁监管的某些方面是为了打击潜在竞争对手。我想问一个由两部分组成的问题。
第一,这是否不公平?如果《人工智能行动计划》除了禁止州级人工智能限制并宣布在版权材料上的培训属于合理使用之外,什么都不做,这是否足够?
SA:首先,我们所呼吁的大部分监管都只是针对最前沿的模型,无论世界上的前沿是什么,都要对这些模型制定一些安全测试标准。现在,我认为这是好的政策,但我越来越觉得世界上大多数人并不认为这是好的政策,我担心监管俘获。所以显然,我有自己的信念,但在我看来,我们不会将其作为世界政策,我认为这有点可怕,但希望我们能尽最大努力找到出路,也许一切都会好起来。没有多少人想毁灭世界。
但可以肯定的是,你不想把监管负担加到整个科技行业。就像我们呼吁的某些事情会打击我们、谷歌和极少数其他人一样。再说一次,我不认为世界会这样发展,我们会在眼前的赛场上比赛。但是是的,我认为说合理使用就是合理使用,各州不会有这套疯狂复杂的不同法规,这将非常非常好。
关于人工智能的前景
主持人:Dario和Kevin Weil都曾说过,或者说从不同角度来说,到今年年底,99%的代码编写工作将实现自动化,这是一个非常快的时间范围。您认为现在这个比例是多少?您认为我们什么时候会超过50%或者我们已经超过了?
SA:我认为在许多公司中,它现在可能已经超过50%了。但我认为代理编码将会带来重大变革,目前还没有人真正做到这一点。
主持人:那里的症结是什么?
SA:哦,我们只需要再多一点时间。
主持人:这是一个产品问题还是一个模型问题?
SA:模型问题。
主持人:您是否仍然应该雇用软件工程师?我认为您有很多招聘信息。
SA:我的基本假设是,每个软件工程师在一段时间内都会做更多、更多的事情。然后到了某个时候,也许我们确实需要更少的软件工程师。
主持人:顺便说一句,我认为您应该雇用更多的软件工程师。我认为这是我在这里的论点的一部分,我认为您需要行动得更快。但您提到了GPT-5。我不知道它在哪里,我们已经期待它很长时间了。
SA:我们两周前才收到了4.5。
主持人:我知道,但我们很贪婪。
SA:没关系。您不必等待。新的不会太久。
主持人:什么是AGI?您有很多定义。OpenAI有很多定义。您目前的定义是什么,什么是AGI的最新定义?
SA:我认为您刚才所说的是关键点,这是一个模糊的界限,涉及很多东西,而且我认为这个术语几乎完全被贬值了。有些人,按照许多人的定义,我们已经到达了那里,特别是如果您可以像将某人从2020年传输到2025年并向他们展示我们所拥有的东西一样。
主持人:嗯,多年来一直是人工智能。人工智能一直是我们无法做到的事情。一旦我们能做到,它就是机器学习。而且一旦您没有注意到它,它就是一个算法。
SA:对。我认为对很多人来说,这大概就是经济价值的一小部分。对很多人来说,这大概就是通用的东西。我认为他们可以把很多事情做得很好。对有些人来说,这大概就是不会犯任何愚蠢错误的东西。对有些人来说,这大概就是能够自我完善的东西,诸如此类。只是两者之间没有很好的协调。
主持人:什么是代理?什么是代理?
SA:一些可以自主地为您完成大量实际工作的事情。
主持人:对我来说,这就是AGI的事情。这相当于取代员工。
SA:但是,如果它只擅长某类任务而不能做其他任务呢?我的意思是,有些员工也是这样的。
主持人:是的,我之所以考虑这个问题 ,是因为这是一个完全的重新定义,AGI原本应该是万能的,但现在我们有了ASI。ASI是一种超级智能。对我来说,这是一个命名问题。ASI可以完成我们交给它的任何工作。如果我得到一个可以完成一项特定工作(编码或其他工作)的人工智能,并且它始终如一地这样做,我可以给它一个目标,它通过找出中间步骤来实现目标。对我来说,这是一个明显的范式转变,我们现在必须在很大程度上引导它。
SA:如果我们有一个很棒的自主编码代理,您会不会觉得“OpenAI 做到了,他们创造了 AGI”?
主持人:是的。这就是我定义它的方式。我同意这几乎是对AGI过去含义的完全削弱。但我只是用ASI代替AGI。
SA:我们能在墙上获得一个本·汤普森的金星吗?
(笑声)
主持人:当然,给您。我将给您我的电路笔。
SA:太棒了。
主持人:您和这些实验室的工作人员谈论了您所看到的情况,以及为什么没有人做好准备,还有各种各样的推文四处流传,让人们激动不已,您在这个播客上透露了一些暗示。非常令人兴奋。然而,您已经谈论这个问题有一段时间了。您发布的消息是否让您看到,在某些方面,这个世界看起来仍然一样?您发布的消息是否比您预期的要少,或者您是否对人类吸收变化的能力感到惊讶?
SA:非常惊讶于后者。我认为有几个时刻,我们做了一些真正让世界崩溃的事情,并说:“这是什么……这真是太疯狂了。”然后两周后,每个人都会说:“下一个版本在哪里?”
主持人:嗯,您也用您的初始策略做到了这一点,因为ChatGPT震惊了所有人。然后不久之后ChatGPT-4出现了,他们说,“哦,我的天哪。我们这里的速度是多少?”
SA:我认为我们发布了一些令人难以置信的东西,我认为这实际上是人类的一个很棒的特质,人们会适应,并且只是想要更多、更好、更快、更便宜的东西。所以我认为我们已经超额完成了任务,人们只是进行了更新。
主持人:鉴于此,这让您更乐观还是更不乐观?你是否看到了我认为在代理人之间会出现的分歧?这是一个不同的代理词,但看看我们的方向。我们需要在这里发明更多的词。我们会要求ChatGPT为我们幻化一个。那些会使用API和整个微软Copilot想法的人会有人陪着你,而且会说很多高话,“哦,它不会取代工作,它会提高人们的工作效率”。我同意,对于一些出去使用它的人来说 ,这种情况会发生。
但你回顾一下PC的历史 。第一波PC是那些真正想使用 PC 的人。很多人没有。他们把一台放在桌子上,必须用它来完成一项特定的任务。真的,你需要一个世代的改变,让人们默认使用它。人工智能,这是真正的限制因素吗?
SA:也许,但这没关系。正如您提到的,这对于其他技术发展来说是标准的。
主持人:但您回过头来看PC的例子,实际上,第一波IT就像大型机,消灭了整个后院。而且实际上,事实证明,第一波是工作取代浪潮,因为它更容易进行自上而下的实施。
SA:我的直觉是,这个不会像那样发展,但我认为预测总是非常困难的。
主持人:您的直觉是什么?
SA:它只是渗入经济,并且主要一点一点地吞噬东西,然后越来越快。
主持人:您经常谈论科学突破是投资人工智能的一个原因,Dwarkesh Patel最近提出了一个观点,即还没有任何突破。为什么没有?人工智能真的可以创造或发现新事物吗?我们是否过度依赖那些根本不好的模型,这才是真正的问题?
SA:是的,我认为这些模型还不够智能。我不知道。您听到使用Deep Research的人说,“好的,该模型没有独立发现新的科学,但它正在帮助我更快地发现新的科学。”对我来说,这几乎是一样好的。
主持人:您认为基于变换器的架构是否可以真正创造新事物,或者它只是互联网的中等水平?
SA:是的。
主持人:那么,那里的突破会是什么?
SA:我的意思是,我认为我们正在走向成功。我认为我们只需要继续做我们的事情。我认为我们正在走向成功。
主持人:我的意思是,这是对上帝的终极考验吗?
SA:怎么说?
主持人:人类具有与生俱来的创造力,还是仅仅是以不同的方式重新组合知识?
SA:我最喜欢的书之一是戴维·德意志的《无限的开始》,在这本书的早期,有几页关于创造力的精美描述,创造力只是获取您之前看到的东西并稍作修改。然后,如果产生了好的东西,其他人会稍微修改它,其他人会稍微修改它。我可以相信这一点。如果真是这样,那么人工智能擅长稍微修改事物。
主持人:您认为您可能相信这一点的程度在多大程度上取决于您长期以来的信念,而不是您所观察到的,因为我认为这是一个非常有趣的——不要变得如此高层次的形而上学或感觉,就像我说的那样,几乎是神学的——但是似乎有一点,一个人的基本假设推动了一个人关于人工智能可能性的假设。而且,硅谷的大部分都是唯物主义的、无神论的,无论您想怎么说。当然,我们会找到答案,这只是一个生物学功能,我们可以在计算机中重新创建它。
如果事实证明我们从未真正创造新事物,但我们增强了人类创造新事物的能力,这会改变您的核心信仰体系吗?
SA:这绝对是我之前的核心信仰体系的一部分。所有这些都不是什么新鲜事,但没有,我假设我们只是还没有找到合适的人工智能架构,并且在某个时候,我们会找到的。
主持人:最后一个问题是代表我的女儿提出的,她今年高中毕业。您对高中毕业的应届毕业生有什么职业建议?
SA:显而易见的策略就是,要真正擅长使用人工智能工具。就像我高中毕业的时候一样,显而易见的策略是,要非常擅长编码。这是它的新版本。
更普遍的是,我认为人们可以培养韧性和适应能力,以及弄清楚其他人想要什么以及如何对人们有用的能力。而且我会去练习这一点。无论您学习什么,它的细节可能并不重要。也许他们从来没有这样做。就像我在学校学到的有价值的事情是学习的能力,而不是我学到的任何具体的东西。因此,无论您将要学习什么具体的东西,都要学习这些普遍的技能,这些技能在世界经历这种转变时似乎会很重要。
主持人:Sam,很高兴和您交谈。我认为我们最后一次真正交谈实际上是在达沃斯,我甚至不会发音,只是为了装傻。当然,每个人都想和你聊天。你是那里的摇滚明星。你假装——我把它理解为假装惊讶,“哦,为什么人们关心我这个小人物?”我想我必须问你,你是假装的还是成为科技界最有名的人感觉如何?
SA:我从未去过达沃斯。那对我来说只是一次性的事情。
(笑声)
主持人:我也是。
SA:非常糟糕的经历。但那是一种奇怪的体验,感觉像一个真正的名人,而我的结论是,这说明了去达沃斯的人,而不是说明我。但我并不喜欢在那里。从相对默默无闻到在短短几年内成为科技界非常出名的人,这很奇怪。
主持人:在世界上非常出名。
SA:当我在旧金山时,我感觉自己受到了非常多的关注。如果我在其他城市,我就可以被放任自流。
主持人:哦,您只是解释了我为什么不想住在旧金山。我的意思是,我的规模比您小得多。
SA:是的。但这一直是一种奇怪的,而且不总是超级有趣的体验。
主持人:Sam Altman,很高兴与您交谈。希望很快能再次交谈。
SA:您也是。谢谢。