据国外媒体报道,OpenAI近日发布了其最新的大语言模型GPT-4o,再次引领了人工智能领域的又一创新浪潮。在此重要时刻,该公司首席执行官山姆·奥特曼(Sam Altman)接受了知名播客节目主持人罗根·巴特莱(Logan Bartlett)的专访,向全球观众揭开了发布会背后的精彩故事,并提供了他对人工智能未来的预测。
在这次专访中,奥特曼不仅详尽地阐述了OpenAI的宏大蓝图,还探讨了实现AGI(通用人工智能)的时间表,以及人形机器人可能带来的深远社会影响。与此同时,奥特曼也对人工智能个人助理的前景表达了自己的兴奋与忧虑,并强调了当今人工智能领域最大的机遇和风险等。
以下为奥特曼与巴特莱对话全文:
01 领导OpenAI让我再难保持“透明”
巴特莱:让我们从较为轻松的话题开始吧!在过去的四五年里,作为OpenAI的领导者,你的生活经历了哪些最不寻常的变化?换句话说,哪些转变对你来说是最为明显的?
奥特曼:许多事情都发生了变化。但其中最令人惊异的是,我再也无法在公众面前保持“透明”。如果之前我稍微预想过这一点,我可能会说,这比想象中更为奇特。但当时我确实没有多想。这就像一种非常特殊的“隔离状态”,让我有些无所适从。
巴特莱:你深信人工智能和OpenAI的力量,那么,在经营这样一家公司时,你有没有预想过它可能带来的连锁反应?
奥特曼:我并未预料到这些。我并没有想到会牵涉到这么多其他的事情,比如公司会成长为一个真正具有影响力的企业。我更加没有预见到,我甚至在自己的城市里都无法自由地外出用餐,这确实让我感到有些奇怪和不可思议。
02 发布多模态AI:技术的一大飞跃
巴特莱:本周早些时候,你们成功发布了多模态大模型GPT-4o,它实现了在文本、语音和视觉之间的无缝交互。你能谈谈为何这一突破如此重要吗?
奥特曼:这无疑是计算机使用方式的一次革命性飞跃。长久以来,我们都有通过语音控制计算机的愿景,如Siri等早期产品。但对我而言,它们的使用体验从未真正达到自然流畅的境界。然而,GPT-4o在使用感受上与前代产品截然不同。它的表现非常自然,这源于多方面因素的完美结合:它功能的丰富性、融入其他模型的迅捷性、语调的自然流畅,以及它所能实现的多样化操作,比如你可以轻松地对它说“嘿,说得更快一点”或者选择另一种声音。这种流畅性和灵活性——无论我们如何称呼它——都让我对新模型爱不释手。
巴特莱:请分享一下你目前更偏好的一些用例场景。
奥特曼:尽管我才使用了一周的时间,但有一个用例让我颇为惊喜。当我全神贯注于工作时,我可以简单地将手机置于桌面之上,而无需频繁地切换窗口或打断我的工作流程。这手机仿佛成为了我与信息之间的另一个桥梁。
举个例子,当我处理某个任务时,我过去常常需要停下来,去其他标签页搜索资料或点击其他链接。而现在,我可以继续手头的工作,直接提问并立即获得响应,而不必转移视线离开我当前在电脑上处理的内容。这种无缝衔接的体验确实令人称奇。
巴特莱:听起来,这一切的背后是技术架构的演进,特别是计算能力的飞跃?
奥特曼:确实,从技术角度来看,这基于我们过去几年在多个领域的积累。我们一直在深入探索音频模型、视觉模型,并努力将它们融合。同时,我们也在探索用更高效的方法来训练我们的模型。这并不是说我们突然之间就拥有了一个革命性的新功能,而是将众多技术元素巧妙地结合在了一起。
巴特莱:考虑到延迟问题,你认为是否需要在设备上开发专门的模型来确保流畅的交互?
奥特曼:对于视频来说,网络延迟确实是一个需要关注的问题。我一直对AR眼镜或其他设备能够实时地与世界交流、感知事物变化的前景充满期待。但网络延迟确实可能成为这一愿景的绊脚石。不过,在实际应用中,两三百毫秒的延迟已经足够迅速,很多时候甚至能超越人类的反应速度。
巴特莱:你最近提到GPT-4o可能不是下一个大型版本的命名,比如GPT-5。这似乎意味着你们在模型开发上采用了更为灵活和迭代的方法。我们是否应该这样看待未来的发展方向?
奥特曼:未来发布的大模型不会是一个标志性的大版本,如GPT-5,因为目前我们还无法确定。我认为,我从中学习到的一点是,人工智能与传统的发布模式并不总是完美契合。科技公司通常遵循着既定的产品发布模式,但我们现在可能需要采取一种不同的策略。我们当然可以沿用GPT-5这样的命名,并以新的方式发布,或者也可以考虑使用其他名称。但我认为,我们还在摸索如何为这些产品命名和建立品牌。
从GPT-1到GPT-4的命名方式对我来说是合乎逻辑的,而GPT-4显然已经取得了显著的进步。我们也在思考,是否会有一个类似“虚拟大脑”的基础模型,在某些情况下可能展现出更深入的“思考能力”。或者,我们也可能探索不同的模型,但用户可能并不关心这些模型之间的差异。因此,我认为我们还在探索如何将这些产品推向市场。
巴特莱:这是否意味着,为了模型取得渐进式进步,我们对计算能力的需求可能会低于历史水平?
奥特曼:我认为,我们总是渴望利用尽可能多的计算能力。然而,现在我们正在见证惊人的效率提升,这无疑是至关重要的。最近发布的亮点之一是语音模式,但也许更核心的是,我们能够以如此高的效率运行它,以至于我们可以向全球用户提供这一服务,而且它的性能达到了世界上顶尖模型的水准。对于希望免费体验ChatGPT的用户,你会发现,GPT-4o与之前的GPT-4和GPT-4 Turbo相比,在某些使用场景下效率方面有显著提升。而且,我认为在这方面我们还有很大的提升潜力。
03 自然语言将成为人与AI主要交流方式
巴特莱:你曾提到ChatGPT本身并没有真正改变世界,它可能只是改变了人们对世界的期望。
奥特曼:是的,我完全认同这一观点。如果以任何经济指标来衡量,你很难找到确切的证据证明ChatGPT确实提高了生产力或产生了其他直接的经济效益。可能在客户服务或某些特定领域有一些体现,但如果你观察全球GDP的走势,你能在ChatGPT发布时明显检测到它的影响吗?恐怕不能。
巴特莱:你认为是否有一个时间点,我们可以确定GDP的增长是由ChatGPT推动的?
奥特曼:我不确定我们能否将这一增长直接归因于某个特定的模型。但我认为,如果我们回顾几十年后的历史数据,我们会看到一系列模型如何逐步推动整个领域的发展,ChatGPT只是其中的一部分。
巴特莱:你认为在接下来的12个月里,哪些应用或领域将展现出最有前途的发展?
奥特曼:由于我个人的工作背景,我自然对编程领域有关偏爱,我坚信这是一个至关重要的领域。
巴特莱:你曾详细讨论了深度专业化模型与通用模型的区别,前者针对特定数据训练并用于特定目的,而后者能够进行真正的推理。
奥特曼:我敢打赌,未来是通用模型大放异彩的时代。
巴特莱:在你看来,什么才是最为重要的?
奥特曼:对于那些仅仅局限于一个数据集和与之紧密相关的狭窄领域的模型来说,如果它们能够拥有泛化推理的能力,那么无论面对何种新的数据类型,只需输入相应的数据,模型便能够迅速适应并运行。但这样的能力并不是通过堆砌一堆专业化的模型所能获得的。因此,我认为最重要的是要弄清楚真正的推理能力,这样我们便可以将其应用于各种场景和任务中。
巴特莱:在设想人工智能在通信和创造力方面的前景时,你认为在未来两年内,人类与人工智能之间的主要交流方式将是什么?
奥特曼:自然语言无疑是一种非常有效的交流方式。我对于这样一个想法很感兴趣:我们可以设计一个人类和人工智能都能共同使用的机制,让它们以相同的方式互动。因此,相比于其他形式的机器人,我对人形机器人更感兴趣。因为当前这个世界在很大程度上是为人类设计的,我不希望因为追求某些所谓的“效率”而让这个世界重新配置。我倾向于这样的观点,即我们使用人类习惯的语言与人工智能交流,他们之间甚至可能采用同样的方式进行交流。尽管我无法预知未来,但我认为这是一个值得探索的有趣方向。
04 未来AI系统将变得便宜又好用
巴特莱:你曾提到模型可能会随着时间的推移逐渐商品化,但在这之前,是否应该首先将模型个性化到每个个体?
奥特曼:这一点我并不确定,但我认为这是一个值得考虑的方向。
巴特莱:除了个性化之外,你认为商业用户界面和易用性是否会在最终赢得用户青睐方面发挥重要作用?
奥特曼:当然,这些因素一直都是至关重要的。你可以想象,在某些情况下,市场或网络效应也会成为关键因素。我们希望智能主体之间能够进行有效的交流,应用商店里有不同的公司提供各种服务。但我认为,商业规则通常都会适用。每当新技术出现时,人们总是说这些规则不再适用,但这样的观点往往是不准确的。
在我看来,尽管开源模型在性能上正逐步接近基准标准,但传统价值创造的方式依然扮演着不可或缺的角色。对于开源模型的崛起,我持乐观态度。正如众多技术流派所展示的那样,开源有其独特的地位,而托管模型亦然,这种多元化的格局非常棒。
巴特莱:关于具体的实施细节,我并不打算深入探讨。但众所周知,不少权威媒体已广泛报道了投资FAB(半导体制造设施)和人工智能基础设施的消息。台积电、英伟达等公司正在积极增产,以满足市场对人工智能基础设施的激增需求。你最近曾提及,全球对人工智能基础设施的需求远超过目前台积电、英伟达等公司的供应能力,你是基于哪些观察或数据得出这一结论的?
奥特曼:首先,我确信我们能够找到途径,大幅降低现有人工智能系统的成本。其次,随着成本的降低,人工智能系统的需求势必将激增。第三,通过构建更大、更先进的系统,我们还将进一步刺激需求的增长。我们共同期待的是一个“智能”极其丰富且便宜的世界,人们可以利用智能技术完成各种各样的任务。你甚至无需思考,比如我是否想要它帮我阅读并回复所有电子邮件,或者我是否想要它帮我治疗癌症。当然,你会选择治疗癌症,但理想的情况是它能够同时出色地完成这两项任务。我关注的是确保我们拥有足够的资源,让每个人都能享受到智能技术带来的益处。
巴特莱:我并不要求你对个人努力做出评价,但如果你愿意分享,我想请教你对于Humane、Limitless等公司推出的不同物理设备助手有何看法?你认为它们有哪些不足之处,或者为何它们的普及程度尚未达到预期的用户需求?
奥特曼:我认为这仅仅是一个开始。作为多种计算设备的早期使用者,我有着丰富的体验。我曾拥有一台紧凑的TC1000,那是我大学一年级时的爱物,它虽不如现在的iPad先进,但方向无疑是正确的。后来,我拥有了一部Treo,在大学时代,我算是那种不太追求时尚的孩子,但我的Palm Treo在当时绝对是个炫酷的存在,尽管它与后来的iPhone相去甚远,但我们都见证了科技的飞跃。这些设备都预示着极具潜力的未来,只是需要时间的打磨和技术的迭代。
巴特莱:你最近曾提及,许多以GPT-4为基础建立业务的公司将不可避免地会被未来的GPT迭代所淘汰。你能进一步详细解释这一观点吗?此外,你认为在GPT的浪潮中,哪些具备人工智能特性的企业能够生存下来?
奥特曼:我发现一个适用的框架是,构建业务时,你其实是在做两种选择:要么赌下一个模型表现平平,要么赌下一个模型会取得显著进步并从中受益。如果你投入大量精力去让某个用例高效运作,而这个用例当前已超出GPT-4的能力范围,一旦GPT-5或后续版本出现并超越这一切,那么你可能会对你先前的努力感到不值。但如果你有一个全面且可行的产品,人们会自然寻求使用它,而你并没有过度投入去让这一产品成为唯一,那么当GPT-5或其他更先进的模型出现时,你的产品将随之变得更好。
我的观点是,大多数时候,你并非在建立一个纯粹的人工智能业务,而是在构建一个业务,人工智能只是你采用的一种技术。在应用商店的早期阶段,有很多产品填补了某些明显的空缺,但随后苹果解决了这个问题,我们现在已经不再关注应用商店里的手电筒应用,因为它们的功能已被集成到操作系统中。这将是未来人工智能业务可能的发展方向。至于优步这样的企业,它们因智能手机的普及而兴起,但它们建立了一个非常稳固且长期可行的业务模式,我认为这正是我们应该追求的方向。
巴特莱:我明白你的意思,而且我能想象出很多应用你们技术理念的企业,它们在某种程度上都符合这一框架。那么,你能否给出一个具体的例子或新型概念,它符合我们之前讨论的模式?例如,Uber这样的公司,它不必是一个真实存在的企业,即使是一个假设性的公司、一个玩具概念,或者只是你认为以这种方式实现的某个想法也可以。
奥特曼:在这个方面,我倾向于押注那些新兴的初创企业。举个例子,当人们想要构建人工智能医生或人工智能诊断系统时,他们会说,“我不想在这个领域创业,因为你知道有梅奥诊所(Mayo Clinic)或其他医院会这样做。”但我实际上更看好那些在这个领域尝试新方法的初创公司。
05 没有AGI,OpenAI估值能达到万亿美元?
巴特莱:对于有志于主动应对此类颠覆性变革的创业者,你有何建议?
奥特曼:我要说的是,坚信智能服务会逐年进步、并且成本下降是必需的,但这还不足以确保你的成功。大公司虽然需要时间来达到这一点,你可以借此优势超越它们,但同样意识到这一点的其他创业公司也会这么做。因此,你仍需深入探索业务的长期可持续性。如今,我们面临的是一个前所未有的开放环境,充满了令人兴奋的新机遇,但请不要因此忽视了在创造价值过程中的辛勤工作。
巴特莱:鉴于人工智能的飞速发展,你能否预测在未来五年内可能涌现或成为主流的新职位类型?这些职位可能是当前鲜为人知或尚未存在的。
奥特曼:这是一个新颖且引人深思的问题,我之前并未被问及过。人们总是关注哪些职业将会消失,但新的职业类别同样令人着迷。我尝试思考的是,例如有1亿或5千万人可能会涉足的新领域。这可能涉及全新的艺术形式、娱乐方式,以及更加注重人与人之间的联系。虽然我不知道这些职位的具体名称,也无法确定我们是否能在五年内达到这样的规模,但我坚信,人们将会珍视像面对面这样独特的人类交流体验。我不清楚我们将如何定义这样的岗位,但我可以预见,这将成为我们未来发展中一个全新且极其重要的领域。
巴特莱:最近OpenAI在融资过程中估值达到了约900亿美元。在你看来,有哪些关键性事件或里程碑,即使OpenAI尚未达到AGI水平,也能推动其估值达到万亿美元?
奥特曼:我认为,只要我们能够继续以当前的速度提升技术,明确如何持续利用它构建出色的产品,并确保收入稳步增长,就像目前的情况一样,那么我坚信我们会取得巨大成功。关于具体的数字,我确实无法预测,但我对我们的未来充满信心。
巴特莱:当前的商业模式(可能指的是ChatGPT等订阅模式)是否是你认为OpenAI能达到万亿美元估值的关键因素?
奥特曼:这种订阅模式对我们而言效果非常显著,超出了我的预期。我原本并未预料到它会如此成功,但事实证明,它运作得相当出色。
巴特莱:在你看来,AGI(无论这个概念如何定义)实现后,商业模式会否发生变化?
奥特曼:那将是另一番景象。
巴特莱:关于OpenAI的现有结构,尽管我们可能已经注意到了一些改进,但我认为我们无需再对此深入讨论。你已经充分阐述了这一点。你提到会在前进过程中进行调整,那么在你看来,一个合适的结构应该是怎样的?
奥特曼:我认为我们即将准备好探讨这个问题了。我们一直在进行各种讨论和头脑风暴。我希望在今年,即这个日历年内,我们能够正式讨论这个问题。
巴特莱:关于人工智能的普遍看法,有一个特别有趣的话题是你的货币化模型观点。我们曾听你提及,首先是取代体力劳动,然后是白领工作,最后是创意工作。显然,这在某些方面被现实所颠覆。还有没有其他与直觉相悖的事情?例如,我原本认为会是这样,但事实却截然相反。
奥特曼:这对我来说确实是一个巨大的意外。除了你提到的那一点,还有其他一些事情,比如我没想到人工智能会如此擅长法律工作,并且会这么早就展现出这样的能力。因为我一直认为法律工作是非常精确和复杂的。
巴特莱:关于人工智能和你对“AGI”这个词持保留态度,你能详细解释一下吗?
奥特曼:因为我知道AGI不再是一个明确的时间点。显然,当你创办一家公司时,你会有很多天真的想法,特别是在这样一个快速发展的领域。OpenAI成立之初,我也曾天真地认为,我们将从没有AGI的时代开始,然后实现AGI,这将是一个真正的飞跃。我仍然认为有可能出现真正的飞跃,但总的来说,我认为它更像是一个连续的指数曲线,重要的是每年取得的进步速度。你和我可能在某个月或某一年达到AGI的具体时刻上不会达成一致。但我们可以想出其他我们会认同的测试方法,然而,这要比听起来要难。
GPT-4肯定没有达到我认为的AGI的阈值,我也不认为我们的下一个大模型会达到这样的水平。但我觉得,我们可能只是缺少某些不太起眼的想法,以及更大一点的规模,就能达到某个让人的程度。
巴特莱:那么,是否存在一个更现代的图灵测试,可以衡量人工智能是否达到了某个特定的阈值?
奥特曼:我认为,当某个系统能够做得比所有OpenAI的研究人员加起来还要好时,哪怕只是超过其中一位OpenAI的研究人员,这都将是一个非常重要的里程碑,感觉它可能会,甚至应该被视为一个突破性的进展。但这样的进展是否即将到来,目前还不太确定,但我不会完全排除这种可能性。
巴特莱:在你看来,实现AGI所面临的最大挑战是什么?你似乎认为当前的扩展定律在未来几年内仍将持续有效。
奥特曼:我坚信,实现AGI的最大障碍在于新的研究突破。自从我从互联网软件领域转向人工智能,我深刻体会到研究并不总是遵循预设的时间表。这通常意味着它可能需要更长时间,但有时候,进展的速度也会远超任何人的预期。
巴特莱:能否详细解释一下,为什么研究的进展并不像工程那样呈现出线性的趋势?
奥特曼:当谈及研究进展的非线性特征时,我想借由历史案例来阐述。尽管我可能会在一些具体数字上有所出入。以中子为例,它在20世纪初被在理论上提及,并在20年代首次被探测到。而原子弹的研究始于30年代,并在40年代成功实现。从对中子一无所知,到能够制造原子弹并颠覆我们对物理学的认知,这一进程展现了惊人的速度。
还有其他例子,如不那么纯粹的科学领域。莱特兄弟曾预测飞行将在50年后实现,而他们在1908年就成功进行了首次飞行。类似这样的例子在科学和工程的历史中不胜枚举。当然,也有很多我们预测中的进展从未实现,或者实现的速度远低于我们的预期。但有时候,进展确实能够异常迅速。
巴特莱:关于可解释性,我们目前在这一领域处于怎样的位置?它对人工智能的长期发展有多关键?
奥特曼:可解释性涉及多个层面,包括我是否理解网络在机械层面上的每一层运作方式,或者我是否能够通过查看输出来指出其中存在的逻辑错误。我对OpenAI以及其他机构在可解释性方面的研究充满期待。我认为,作为一个更广泛的领域,可解释性具有巨大的潜力和令人兴奋的前景。
06 对当前AI模型实施过度监管是个错误
巴特莱:随着人们对AGI的期待日益高涨,关于OpenAI等组织单方面利用其并做出决策的担忧也在增加。这促使一些政府机构介入,希望由选举产生的领导者来做出这些决策,而非完全依赖OpenAI等公司。
奥特曼:我认为,对于当前的人工智能模型实施过度的监管将是一个错误。然而,当这些模型开始给世界带来重大灾难性风险时,某种程度的监管就显得尤为重要。目前,如何设定这些风险的阈值以及如何有效测试它们,确实需要我们仔细权衡。如果因为过度担忧潜在风险而限制了这项技术的巨大优势,让那些希望在自家地下室训练模型的人望而却步,那将是一个巨大的损失。但话说回来,如果我们用国际核武器规则作为参照,我认为对人工智能进行某种形式的监管是合理的。
巴特莱:关于常规的监管措施,你认为政府机构没有意识到人工智能内在的潜在风险吗?
奥特曼:我认为,他们并没有真正深入研究过AGI。这些人中,有些曾经强烈反对人工智能的监管,认为那是无稽之谈(当然,不是所有人都是如此,但我理解他们的立场)。我理解他们的担忧,因为监管对技术行业确实有过负面影响,比如看看欧洲技术行业的现状。但我认为,我们正逐渐接近一个临界点,超过这个点,情况可能会大不相同。
巴特莱:你认为开源模型本身在某些方面是否存在固有的危险性?
奥特曼:目前来说,并没有。但我可以想象,未来可能会有这样的模型出现。
巴特莱:我记得你曾提到,安全在某种程度上被当作了一种错误的框架,因为它更多地关注我们明确接受什么。
奥特曼:确实如此。以航空公司为例,安全并非一个非黑即白的概念。人们选择乘坐飞机,是因为他们认为相对安全,尽管他们知道偶尔会有飞机失事。如何定义一家航空公司是否安全,是一个值得讨论的问题,不同的人会有不同的看法。航空业已经变得极其安全,但安全并不意味着绝对没有人在飞机上丧生。同样,医学领域我们也非常重视副作用,因为有些人会对药物产生不良反应。此外,安全还有其隐性的一面,比如社交媒体可能带来的负面影响。
巴特莱:在安全方面,有没有一个特定的情境或因素,会让你改变当前全力推动人工智能研究的策略?
奥特曼:我们有一个称之为“准备框架”的概念,它正是针对这一点的。在特定的类别和层面上,我们的行动策略会有所不同,以应对潜在的风险和挑战。
巴特莱:考虑到众多快速涌现的应用场景,我认为我们当前面临的一个主要瓶颈是人工智能基础设施的不足。假设有研究人员对现有的神经架构Transformer进行了某种突破性的改进,使得所需的数据量和硬件大幅减少,甚至接近人脑的水平,那么你认为这是否会加速“技术飞跃”?
奥特曼:这种可能性确实存在。而且,这种改进并不一定需要完全颠覆现有的架构。尽管我不认为这是最直接的路径,但我也不会完全排除它。重要的是,我们要在可能发生的各种情况中考虑到这一点。
我认为,即使技术发展在加速,这个过程也会是渐进的。我不认为我们会在一夜之间从相对先进的人工智能一跃成为真正的超级智能。但即便技术突破发生在一年或几年内,这在某种程度上来说仍然是快速的。
另一个要考虑的是,即使我们拥有了真正强大的AGI,它在短期内对社会的影响也是有限的。我猜测,大多数情况下,它不会在一年或两年内产生足够大的影响,但在十年内,世界绝对会发生巨大的变化。在这方面,社会的惯性实际上可能是一个积极的因素。
07 感叹人的适应能力强,退休后希望享受田园生活
巴特莱:我想你有注意到,大家对你不太愿意回答的问题持有怀疑态度。比如关于埃隆·马斯克(Elon Musk)、股权和董事会结构的问题,这些都是你经常被问到的。那么,这些问题中你最不喜欢回答的是哪一个?
奥特曼:我并没有讨厌回答其中任何一个问题,但关于这些问题,我确实没有新的内容要分享。
巴特莱:好吧,我猜我不会特别追问关于股权的问题,因为你已经以足够多的方式回答了它,尽管人们似乎仍然对“拥有足够的资金是有益的”这个答案持保留态度。
奥特曼:是的,即使我真的赚了一万亿美元并全部捐出,也可能仍然无法满足某些人的期望或传统观念。有些人甚至尝试过以某种方式去这样做。
巴特莱:你追求AGI的动机是什么?抛开股权不谈,我相信大多数人都会觉得,即使他们追求的是更高的使命,得到相应的报酬也会是一种安慰。那么,你每天来工作的动力是什么?你又从哪里获得最大的满足感?
奥特曼:我总是告诉人们,我愿意在生活的其他方面做出许多牺牲和妥协,因为目前我接触到的这项事业是我认为最激动人心、最重要、最美好的。这是一个充满变革的时代,我深知它不会永远持续下去。你知道,总有一天我会选择退休,享受田园生活,我会怀念现在的一切,但也会笑着说:“哦,那些日子真是既漫长又充满压力,但同样也是无比酷炫的。”我简直不敢相信这会发生在我身上,这太神奇了。
巴特莱:是否有一个特定的瞬间,让你感到仿佛置身于一个超现实的场景之中?比如之前我们提到的名声带来的困扰,比如无法自由地在你所在的城市中活动。
奥特曼:每天都会有一些事情让我惊叹。之后,随着各种事情的发生,比如那个星期(去年11月份被董事会罢免),我收到了来自世界上一些重要人物,如总统、国家总理等的10到20条短信,但这并不是让我感到奇怪的部分。让我感到真正奇怪的是,当这一切发生时,我像是在正常地回应他们,发送“谢谢”之类的信息,感觉一切都非常自然。
我们度过了那四天半疯狂而紧张的时光,我几乎没有睡觉,也没有怎么吃东西,但我的精神却出奇地好,头脑清晰,极度专注。这就像你的身体长时间处于某种奇异的肾上腺素充能状态。这一切发生在感恩节前的那个星期,那真是一个疯狂的体验。到了周二晚上(2023年11月21日),所有的事情都解决了。然后那个周三,我开车去了纳帕,在一家小餐馆停下来,那里的食物非常美味。
所以,那是一个让人印象深刻的时刻。我深深体会到,人类对于几乎任何事情的适应能力都远超我们的想象。你可以很快地将任何事情当作新的常态,无论是好是坏。在过去的几年里,我多次从这样的经历中学习到这一点。但我认为,这恰恰展现了人类的一些非凡之处,而这对我们来说是一件好事。
08 未来AI助手应与人类本体分离
巴特莱:这些心理层面的影响确实频繁出现,令我颇为惊讶。在你看来,随着人类和大模型开始承担更多过去仅由人类完成的任务,哪些特质或能力仍将是人类所独有的呢?
奥特曼:我认为多年以后,人类依旧会深深地关心着其他的人类。我刚刚在网上浏览了一些内容,大家都在说“每个人都会爱上ChatGPT”之类的话。但敢我打赌,这种情况不会发生。我认为我们长期关心其他人类,以各种不同的方式,这一点将永远存在。我们对他人的关心几乎可以说是一种固有的执着。虽然你可能听说过许多关于我的阴谋论,但你可能并没有听到很多关于人工智能的阴谋论。如果你听到了,我可能不会太在意。我认为,我们不会把观看机器人踢足球当作主要的娱乐爱好。
巴特莱:作为OpenAI的创始人,你为公司设定了许多商业运作的规则或框架,但你同样打破了不少规则。在这个行业中,你雇佣的员工类型是否与其他消费者互联网公司、B2B软件公司或其他类型的公司有所不同?
奥特曼:研究人员与产品工程师在大多数情况下确实存在显著的差异,而高管们也同样具有其独特性。
巴特莱:OpenAI是否引入了不同类型的高管?或者你在招聘高管时是否特别注重某些特质?
奥特曼:我通常并不倾向于从外部聘请高管,但我认为,如果公司总是仅从内部提拔高管,这可能是一个错误,因为这可能会导致公司文化的单一化。我认为公司需要引入一些新的高级人才来注入活力。但在这里,我们主要还是依赖本土人才,考虑到我们所做的事情的独特性,这实际上是一件好事。
巴特莱:在OpenAI的发展历程中,你是否做出过某个在当时感觉至关重要的决定?你是如何做出这个决定的?
奥特曼:这很难只指向一个单独的决定,但我们可以提及的是,我们决定采用所谓的迭代部署策略,即我们不会秘密地开发AGI,然后一次性将其推向世界。这是当时许多公司和人们的普遍观点和计划,但我认为这个决定非常关键,而且在当时看来确实非常重要。
巴特莱:对于押注语言模型的背后故事,我实际上一直感到好奇。这一决策是如何产生的?
奥特曼:当时,我们团队正专注于多个项目,包括机器人开发和视频游戏。然而,在这个多元化的背景下,一个相对较小但充满热情的团队开始投身于语言建模的研究。伊利亚(Ilya Sutskever,OpenAI前首席科学家)对此方向深信不疑,他坚信语言模型的发展潜力。
于是,我们着手进行了GPT-1和GPT-2的研发,并深入研究了缩放定律,进而升级到了GPT-3。正是基于这些经验和研究,我们做出了这个大胆的决策,决定将重心放在这一方向上。尽管现在回想起来,这些选择似乎显而易见,但在当时,它们确实是经过深思熟虑的决策。
巴特莱:当你谈到使用个人人工智能时,你提到了这两者之间的区别。但能否请你进一步详细解释呢?因为我认为这对你关于未来人工智能用例的思考具有深远的影响。
奥特曼:当然。当我在未来五年内收到你的短信时,我希望能够清楚地知道,这是你直接发给我的,还是由你的人工智能助手代为转发的。
我认为,保持这种明确的界限是有价值的,而不是让一切变得模糊不清,仿佛人工智能只是我们身体或思维的延伸。我希望能够清楚地分辨出,我是在和山姆本人交谈,还是与山姆的人工智能助手交流。我认为,这样的区分是必要的,也是我希望在未来能够实现的体验。
巴特莱:在规划AGI及其后续发展时,你提到第一个AGI仅仅是智能连续体上的一个起点,我们之前已经讨论过这一点。你认为从哪里开始,AGI的进步很可能会加速?你有没有停下来过,深入思考或想象过未来的具体样子?或者它是否太过抽象,以至于无法具体描绘?
奥特曼:我并不觉得它太过抽象,但我也不会将它想象成《星球大战》中未来城市那样大场景。但我想象过这样的画面:当一个人能够独当一面,完成原本需要数百乃至数千人协调配合才能完成的任务时,或者当我们真的能够揭示所有的科学奥秘时,那会是多么酷的一件事。
本文来源:腾讯科技,原文标题:《OpenAI掌门人最新专访:GPT-4o让我爱不释手 下代大模型可能不叫GPT-5》