OpenAI推出o3 pro,奥特曼专门为此发长文「平缓的奇点」:AI发展越过了“事件视界”

AI寒武纪
o3-pro能为用户提供最可靠、最精准的回答,尤其是在对准确性要求极高的复杂任务中。最震撼的是相较于o1-pro,o3-pro的价格降低了87%。奥特曼发文预测,2026年我们或许将迎来能够发现全新洞见的系统。到了2027年能够在现实世界中执行任务的机器人可能就会问世。

刚刚OpenAI正式推出o3-pro,奥特曼专为此写了一篇名为《平缓的奇点》的文章

o3-pro能为用户提供最可靠、最精准的回答,尤其是在对准确性要求极高的复杂任务中。现在向所有 ChatGPT 和 API 的 Pro 个人用户推出,企业版和教育版用户还得等一周,另外plus用户o3的速率限制将翻倍

本次发布最震撼的是相较于o1-pro,o3-pro的价格降低了87%

这是o1-pro,o3-pro,o3的输入输出价格具体比较

如果你认为奥特曼文章又是炒作或者你对文章不感兴趣,但至少文章中这一段可以吸引你

很多人都会问,一次ChatGPT查询究竟用多少电?答案是:平均每次查询消耗约0.34瓦时。这个电量,差不多就是一个烤箱运行一秒多,或者一个高能效灯泡亮上几分钟。不仅如此,每次查询还会用掉约0.000085加仑的水,换算一下,也就十五分之一茶匙那么多

奥特曼在文章中还预测2026年,我们或许将迎来能够发现全新洞见的系统。而到了2027年,能够在现实世界中执行任务的机器人可能就会问世,全文附在文后,先来看看o3 pro的表现

核心特性:为极致可靠性而生

o3-pro 的定位非常明确:当任务的可靠性远比响应速度更重要时,它将是最佳选择

深度思考能力: 与其前代产品o1-pro相比,o3-pro被设计用于解决更具挑战性的问题。它会花费更长的时间进行推理和分析,官方表示“多等待几分钟的权衡是值得的”

强大的集成工具集: 如同o3模型,o3-pro能够无缝调用多种工具来增强其能力,包括实时网页搜索、分析上传文件、理解视觉输入、执行Python代码以及利用记忆功能提供个性化回答

获得专家一致认可: 在由专家进行的评估中,o3-pro在所有测试类别中都获得了比o3更高的偏好度。尤其在科学、教育、编程、商业和写作辅助等关键领域,其回答的清晰度、全面性、指令遵循能力和准确性均获得了持续性的更高评分

性能

1. pass@1 评估(首次尝试成功率)

这项指标衡量模型一次性成功解决问题的能力。

竞赛数学 (AIME 2024):o3-pro (93%)> o3 (90%) > o1-pro (86%)

博士级科学问题 (GPQA Diamond):o3-pro (84%) > o3 (81%) > o1-pro (79%)

编程竞赛 (Codeforces):o3-pro (2748 Elo)> o3 (2517 Elo) > o1-pro (1707 Elo)

2. “4/4 可靠性”评估

这是OpenAI一项更为严苛的测试,要求模型在对同一问题的四次独立尝试中全部正确回答才算成功,以此衡量模型的稳定性和可靠性

竞赛数学 (AIME 2024): o3-pro (90%)优于 o3 (80%) 和 o1-pro (80%)

编程竞赛 (Codeforces): o3-pro (2301 Elo)领先 o3 (2011 Elo) 和 o1-pro (1423 Elo)。

当前限制

由于正在解决一个技术问题,临时聊天功能目前在o3-pro中被禁用

o3-pro 不支持图像生成。用户如需生成图片,请使用 GPT-4o, OpenAI o3, 或 OpenAI o4-mini 等模型

Canvas(画布)功能目前也暂不支持o3-pro


平缓的奇点

作者:Sam Altman

https://blog.samaltman.com/the-gentle-singularity

我们已经越过了事件视界(注:事件视界是黑洞周围的一个边界。一旦任何物体包括光越过了这个边界,它就再也无法逃脱黑洞的巨大引力,注定会被吸入其中),起飞已经开始。人类正接近于构建出数字超级智能,而至少到目前为止,这一切的进展远没有想象中那么离奇。

机器人尚未在街头漫步,我们大多数人也还未整日与AI交谈。人们依然会因疾病而逝,我们仍无法轻易地前往太空,宇宙中还有太多我们无法理解的奥秘。

然而,我们最近构建的系统已在许多方面超越了人类,并且能显著放大使用者的产出。这项工作中最艰难的部分已经过去;那些引领我们走到GPT-4和o3等系统面前的科学洞见来之不易,但它们将指引我们走向更远的未来。

AI将从多方面为世界做出贡献,但其中最大的增益,将来自于AI推动科学进步和生产力提升所带来的生活质量飞跃。未来可以比现在美好得多。科学进步是整体进步的最大驱动力,一想到我们未来能拥有更多,就令人无比兴奋。

从某种宏大的意义上说,ChatGPT已经比历史上任何人类都更加强大。每天,数以亿计的人依赖它完成日益重要的任务。一项微小的新功能就能创造巨大的积极影响;而一个微小的失调,在数亿用户的规模下,也可能造成巨大的负面冲击。

2025年,我们见证了能够完成真正认知工作的智能体的诞生,编写计算机代码的方式将被永远改变。2026年,我们或许将迎来能够发现全新洞见的系统。而到了2027年,能够在现实世界中执行任务的机器人可能就会问世

将有更多的人能够创作软件和艺术。但世界对这两者的需求远未满足,只要专家们愿意拥抱新工具,他们很可能依然会比新手出色得多。总的来说,到2030年,一个人能完成的工作量将远超2020年,这将是一个惊人的变化,很多人都将找到从中受益的方式。

在最重要的方面,2030年代或许不会有天翻地覆的变化。人们依然会爱自己的家人,表达自己的创造力,玩游戏,在湖中游泳。

但在其他同样非常重要的方面,2030年代可能会与以往任何时代都截然不同。我们不知道我们能超越人类水平的智能多远,但我们即将找到答案。

在2030年代,智能和能源——也就是想法,以及将想法变为现实的能力——将变得极其充裕。长久以来,这两者一直是限制人类进步的根本因素。有了充裕的智能和能源(以及良好的治理),理论上我们可以拥有其他任何东西。

我们已经生活在一个拥有惊人数字智能的世界,在最初的震惊过后,大多数人已经习以为常。我们很快就从“惊叹AI能写出优美的段落”转为“思考它何时能写出一部优美的小说”;从“惊叹它能做出拯救生命的医疗诊断”转为“思考它何时能研发出治愈方法”;从“惊叹它能编写小程序”转为“思考它何时能创建一家全新的公司”。这就是奇点的演进方式:奇迹将变为常态,再变为基础标配。

我们已经从科学家那里听说,他们的生产力比使用AI之前提高了两到三倍。先进AI的意义非凡,但也许没有什么比我们能用它来加速AI自身的研究更重要了。我们或许能发现新的计算基底、更好的算法,以及天知道还有什么。如果能用一年甚至一个月的时间完成过去十年的研究,那么进步的速度显然将截然不同。

从现在起,我们已有的工具将帮助我们获得更多的科学洞见,并协助我们创造出更好的AI系统。当然,这不等同于一个AI系统完全自主地更新自己的代码,但这无疑是一种递归式自我完善的雏形。

还有其他自我强化的循环正在发挥作用。AI创造的经济价值已经开启了基础设施建设的复合增长飞轮,以运行这些日益强大的AI系统。而能够制造其他机器人的机器人(某种意义上,能建造其他数据中心的数据中心)也已不再遥远。

如果我们必须用传统方式制造出首批一百万个人形机器人,但之后它们便能运营整个供应链——挖掘和提炼矿物、驾驶卡车、运营工厂等等——来制造更多的机器人,而这些机器人又能建造更多的芯片工厂、数据中心等,那么进步的速度显然将截然不同。

随着数据中心生产的自动化,智能的成本最终应趋近于电力的成本。(人们常好奇一次ChatGPT查询消耗多少能源:平均一次查询大约消耗0.34瓦时,相当于一个烤箱工作一秒多,或一个高效灯泡亮几分钟。它还消耗约0.000085加仑的水,大概是十五分之一茶匙。)

科技进步的速度将持续加快,而人类适应几乎任何事物的能力也将一如既往。过程中会有非常艰难的部分,比如整个类别的岗位消失,但另一方面,世界财富的增长将如此之快,以至于我们能够认真考虑我们以前从未敢想的新政策理念。我们或许不会一蹴而就地采纳新的社会契约,但几十年后回望,这些渐进的改变将汇聚成巨大的变革。

如果历史可为借鉴,我们会找到新的事情去做,产生新的欲望,并迅速吸收新工具(工业革命后的职业变迁就是一个很好的近代例子)。人们的期望会提高,但能力也会同样迅速地提升,我们都将拥有更好的东西。我们将为彼此创造出越来越美好的事物。人类相对于AI有一个长期、重要且奇特的优势:我们的天性就是关心他人以及他们的想法和行为,而我们对机器则没有那么在意。

一千年前的自耕农看到我们今天所做的很多事,会说我们从事的是“虚假的工作”,觉得我们只是在自娱自乐,因为我们早已食物充足、奢侈品多到无法想象。我希望一千年后的人们看待未来的工作时,也会觉得它们非常“虚假”,但我毫不怀疑,从事这些工作的人们会感到它们无比重要且令人满足。

新奇迹实现的速度将是惊人的。我们今天甚至难以想象到2035年我们会发现什么;也许我们会在一年内解决高能物理学难题,然后在下一年开启太空殖民;或者在一年内取得重大的材料科学突破,然后在下一年实现真正的高带宽脑机接口。许多人会选择以大致相同的方式生活,但至少有些人可能会决定“接入”网络。

展望未来,这一切听起来令人难以置信。但亲身经历时,可能会感觉虽震撼却尚可驾驭。从相对论的视角看,奇点是逐步发生的,融合是缓慢进行的。我们正在攀登指数级技术进步的漫长弧线;向前看时,它似乎总是陡峭垂直;向后看时,又显得平坦无奇,但它其实是一条平滑的曲线。(回想一下2020年,如果有人说2025年我们将拥有接近AGI的东西,听起来会有多疯狂?再看看过去这五年实际的经历,便会明白。)

伴随着巨大的上行潜力,我们也需要直面严峻的挑战。我们必须在技术和社会层面解决安全问题,但鉴于其经济影响,将超级智能的访问权限广泛地分配出去也至关重要。最佳的前进道路可能是这样的:

首先,解决对齐问题,即我们能稳健地保证AI系统能够学习并按照我们人类集体的长期真实意愿行事(社交媒体的信息流就是未对齐AI的例子:那些算法在让你持续滑动方面表现出色,清楚地理解你的短期偏好,但它们是通过利用你大脑中覆盖了你长期偏好的机制来实现这一点的)。

然后,专注于让超级智能变得廉价、普及,并且不会过度集中在任何个人、公司或国家手中。社会是富有韧性、创造力且适应迅速的。如果我们能驾驭人类的集体意愿和智慧,那么尽管我们会犯很多错误,有些事情会出大问题,但我们将能快速学习和适应,并利用这项技术实现效益最大化和风险最小化。在社会必须决定的广泛边界内,给予用户大量的自由,似乎非常重要。世界越早开始就这些广泛边界是什么以及我们如何定义集体对齐展开对话,就越好

我们(整个行业,不仅是OpenAI)正在为世界构建一个大脑。它将是高度个性化的,每个人都能轻松使用;我们的限制将是好的想法。长久以来,初创圈的技术人员一直取笑那些“只有想法的人”,他们有一个点子,然后四处寻找团队来实现它。现在在我看来,他们大放异彩的日子即将来临。

今天的OpenAI已身兼数职,但归根结底,我们首先是一家超级智能研究公司。我们面前还有大量工作,但前路的大部分已被照亮,黑暗的区域正在迅速退去。能够从事我们现在所做的事,我们感到无比幸运。

“智能廉价到无需计量”的时代已触手可及。这听起来可能有些疯狂,但如果我们在2020年告诉你我们今天会达到这个位置,那听起来可能比我们现在对2030年的预测更加疯狂。

愿我们能平稳、顺利地,以指数级的方式,进入超级智能的时代。

本文来源于:AI寒武纪,作者:AI寒武纪,原文标题:《重磅!OpenAI推出o3 pro,奥特曼专门为此发长文「平缓的奇点」:AI发展越过了“事件视界”》

风险提示及免责条款
市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。
相关文章