在刚刚过去的一段时间里,全球科技与资本市场经历了一场前所未有的剧烈震荡。纳斯达克指数遭遇非理性抛售,而大模型基本面却迎来了史诗级的大爆发。
华尔街公认对科技、半导体及市场历史周期研究最深厚的顶级投资人、Atreides Management 创始人兼首席投资官(CIO)Gavin Baker,近期做客《Invest Like The Best》播客。他以极其硬核的视角,全面复盘了这场资本主义商业史上最非凡的“指数级爆发”,并首次解构了底层技术演进(如推理模型爆发、预填充与解码解耦)对华尔街一二级市场、私募信贷乃至地缘政治格局的降维打击。
核心观点摘要:
商业史奇迹:Anthropic 在短短一个月内增加了110亿美元的ARR(年经常性收入),其爆发体量等同于 Palantir、Snowflake、DataBricks 三大 SaaS 巨头过去 10 年奋斗的总和。
定价模式巨变:AI 商业模式正从包月不限量的“无限畅饮(All-you-can-eat)”全面转向按 Token 消耗计费的“按杯付费(Pay by the drink)”,这将驱动头部实验室今年 ARR 突破 2000 亿美元。
泡沫防火墙:台积电坚守晶圆产能限制,单枪匹马地阻止了由于下游过度建设可能导致的严重行业崩溃。
技术解耦拯救金融:AI 运行阶段“预填充(Prefill)”与“解码(Decode)”的物理分离,大幅延长了旧一代 GPU 的资产清偿寿命(从 2-3 年延长至 10-15 年),直接挽救了深陷坏账危机的私募信贷行业。
掌控现代机关枪:AI 在应用层正“净毁灭”数万亿美元价值。投资人和创始人如果不成为掌控 AI 智能体(Agent)这挺现代机关枪的大师,就会被其成片屠杀。
资本主义史上的指数级奇迹:Anthropic 一个月抵 SaaS 三巨头十年体量
过去 10 到 12 年里,硅谷最受瞩目的三家企业级软件(SaaS)和云革命基石公司是 Palantir、Snowflake 和 DataBricks。这三家公司雇佣了数万人,花费了整整 10 年的时间不懈奋斗,才建立起如今名震华尔街的业务规模。
然而,Anthropic 在短短一个月内增加的 ARR(年经常性收入)体量,就等同于这三家公司过去 10 年合并业务的总和(增加了 110 亿美元的 ARR)。
“在整个资本主义历史和美国商业史上,从来没有发生过这种量级的指数级增长。忘掉我的职业生涯吧,这纯粹是人类商业史上的奇迹。”Gavin Baker 惊叹道。
许多投资者似乎在盲目后悔错过了 2022 年底或此前的行业大底,但在今年 4 月初市场恐慌抛售时,核心大模型的估值再次回落到极具吸引力的区间,且 AI 的行业爆发拐点比以往任何时候都更加清晰。
针对 OpenAI 与 Anthropic 的资本效率对比,Gavin 提出了一个全新的评估指标——URR(Unconstrained Run Rate Revenue,不受限运行率收入)。
由于 Anthropic 生成单个 Token 的成本显著低于 OpenAI(在达到相似收入规模的过程中,Anthropic 比 OpenAI 少烧了大约 80% 的资金),如果未来算力芯片的供应完全不受限制,Anthropic 的真实年化收入理论上可能已经冲高至 1500 亿甚至 2000 亿美元。
帕累托前沿残酷位移:从“无限畅饮”向“按杯付费”的商业模式迁徙
在模型层面上,AI 展现出了极其残酷的虹吸效应:几乎所有的经济回报依然死死锁在极少数的前沿模型(Frontier Models)手中。
此前由中国 DeepSeek 推理模型论文发布引发的“DeepSeek 星期一”市场暴跌,在 Gavin 看来是一次典型的市场定价错误:
“那篇论文恰恰证明了:新一代的推理模型(Reasoning Models)在运行(Inference)阶段比传统的非推理模型要消耗多得多的算力。随着亚洲、美国可用区的 GPU 租赁价格和 DRAM 价格走向垂直狂飙,这表明前沿 Token 正在捕获超乎想象的底层价值。”
与此同时,分析 AI 实验室最核心的坐标轴——帕累托前沿(Pareto Frontier,即智能表现 vs 部署成本的极限平衡线)正在发生残酷的位移:
-
谷歌(Google):由于在此前 TPU V8 的自主化芯片设计上采取了相对保守的路线(试图以此摆脱博通和英伟达的牵制),导致其暂时失去了每 Token 成本的绝对领先地位。
-
领跑者格局:目前的帕累托前沿由 Anthropic 的 Claude、OpenAI 的 GPT 以及 xAI 的 Grok 4.3(目前被视作最强、成本最低的 5000 亿参数模型)共同统治。
更为重大的底层质变在于大模型计费机制的根本逆转。
AI 行业正在复制 2000 年代电信行业从“包月不限量(All-you-can-eat)”向“按使用量计费(Pay by the drink)”的商业跨越。
如果用户仅依赖平价的固定月费套餐,大模型在后端为了控制算力成本,实际上会被严重“切除前额叶”(例如 Claude 在后台会隐性减少 70% 的 Token 输出)。
而当今的企业为了让成百上千个 AI Agent(智能体)同时进行多步骤的深度思考,必须采用按 Token 真实消耗计费的商业模式。
这种向“按杯付费”的跨越,将推动前沿模型实验室的整体 ARR 在今年迅速突破 2000 亿美元大关。
瓦特与晶圆的供给真相:台积电单枪匹马阻止了全球泡沫
每当颠覆性新技术(如当年的铁路、运河、光纤网络)到来时,市场往往会陷入由“多样性崩溃(Breakdown in Diversity)”引发的盲目看涨与恶性资产泡沫。
然而,当前的 AI 基础设施建设与 2000 年互联网泡沫存在着两大本质区别:
-
资金来源:目前的资本开支压倒性地由各大科技巨头极其健康的经营现金流(Operating Cash Flows)提供资助,而非当年的高杠杆负债融资。
-
利用率:当今被送往数据中心的每一个 GPU 都在 100% 满负荷运转,而 2000 年泡沫破裂时,全美 99% 的铺设光纤都是长期闲置的。
更有趣的是,Gavin 透露,英伟达(Nvidia)CEO 黄仁勋与台积电做生意从来没有签署过正式的法律合同(Contract),庞大的产能分配完全是依靠基于长期公平原则的“握手(Handshakes)”来决定。
“台积电控制的晶圆根本性短缺,实际上单枪匹马地挽救了整个行业,阻止了泡沫的产生。”
Gavin 指出。如果台积电完全放开产能去满足英伟达的所有潜在需求,英伟达在未来一两年内能卖出 2.5 万亿到 3 万亿美元的 GPU。但下游市场和消费者的消化是有物理极限的,那将直接导致灾难性的过度建设和全行业大崩盘。正是台积电在晶圆端的克制和物理瓶颈,成为了对抗非理性投机的坚固防火墙。
马斯克的太空野心与德州 Terafab 的“人才小镇”策略
针对地球上日益吃紧的瓦特(电力)短缺,除了利用报废喷气发动机改装等创新发电方式外,Gavin 重新定义了市场的终极解药——太空轨道计算(Orbital Compute)。
“人们听到太空数据中心总以为是要在轨道上建一个五角大楼,那太愚蠢了。它字面意义上就是把一个个重 3000 磅、高 8 英尺的英伟达 Blackwell 服务器机柜直接作为卫星本体送入太空。”
将太空机柜保持在太阳同步轨道(Sun-synchronous orbit)上,能确保太阳能翼板永远暴晒在阳光下获取无限电力,同时将数百英尺长的散热板延伸在背阴的阴影后方。机柜之间通过真空中的激光(Laser cross-links)进行互联,构成庞大的虚拟数据中心。这种模式极其适合高算力消耗的推理(Inference)任务,而大模型的训练(Training)在很长一段时间内仍将在地球上进行。
而在地球上,由 SpaceX/特斯拉与英特尔合作筹建的美国本土超级晶圆厂项目 Terafab 正在颠覆传统的半导体工程文化。
由于埃隆·马斯克在硬件工程领域的巨大声誉,包括 ASML、KLA、Lam Research 及应用材料在内的全球半导体前道设备巨头,均派出了最顶尖的 A 团队(A-teams)前往德州现场提供工程支持。
马斯克的破局奇招在于打破传统跨国招募的限制:他计划在德州 Terafab 旁边直接建立全套配套的“中国台湾城(Taiwan Town)”、“日本城(Japan Town)”和“韩国城(Korea Town)”,将亚洲顶尖工程师家乡最好的餐厅、生活配套和全套服务人员原封不动搬到美国,提供极其无缝的居住体验,以此精准收割全球最顶尖的硬件工程天才。
预填充与解码解耦:延长 GPU 寿命十年的技术,如何拯救了私募信贷?
在半导体芯片设计领域,试图复制英伟达的路线做一个“更好的 GPU”几乎是死路一条,因为英伟达在台积电供应链和模型端拥有不可撼动的定价权和绝对的信息差。初创芯片公司(如 Cerebras 选择的晶圆级计算路线)必须在芯片设计的“铁三角(Iron Triangle)”中做出极致困难且不同的架构抉择。
当前整个芯片架构界最重大的技术飞跃,在于将大模型运行过程中的预填充(Prefill)阶段与推理/解码(Decode)阶段进行物理上的解耦(Disaggregation)。
这种物理任务的拆分和解耦,带来了一个颠覆性的宏观经济涟漪效应:
投资者可以把专门用于加速解码的芯片(如 Cerebras 系统或类似 Groq 的 LPU 架构)直接挂载在英伟达 Hopper 或 Ampere 等老一代旧显卡的前端。让旧 GPU 专门退居二线去负责处理对内存带宽要求不高的预填充任务,从而将原本只有 2-3 年技术过时寿命的旧 GPU,其有效清偿寿命大幅延长到了 10 到 15 年。
这一改变在数学模型上彻底拯救了深陷 SaaS 坏账泥潭的私募信贷(Private Credit)行业。它不仅将 GPU 的资产折旧期限大幅拉长,还将整个 AI 算力中心基础建设的设备融资成本从 7% 以上直接砸到了 5% 左右,彻底改写了一级市场的金融数学模型。
应用层的“价值净毁灭”与 AI 时代的“最后的武士”
与基础设施层的疯狂捞金形成鲜明对比的是,AI 在软件应用层(Application Layer)实际上已经净毁灭(Net destroyed)了数万亿美元的市值。
能够在一轮轮洗牌中建立规模优势并活下来的初创应用,必须满足“不同且硬核”的条件。
例如 Cursor 和 Cognition 之所以能突出重围,是因为他们在 18 个月前其他所有人都在做宽泛应用时,死死锁定了“代码生成(Coding)”这一垂直路径。写代码被公认为通往 ASI(人工通用智能)最短的路径,因为足够聪明的 AI 可以通过写代码来自动强化自身。
Gavin Baker 借用 20 年前汤姆·克鲁斯的经典电影《最后的武士》(The Last Samurai)来隐喻当今时代的人类境遇:在电影结局中,那些历经百战、刀法精妙的传统老武士,最终在手持现代机关枪的农民军队面前被成片地成片屠杀。
“AI 技术就是这挺现代机关枪。在当前的时代,如果我们不都成为掌控这挺现代机关枪的大师,我们就会被它掌控。”
他透露,自己目前在后台全天候运行大量的 AI 智能体(Agent)。其中最实用的一款 Agent 能够帮他把每天长达 6 小时的科技与投资播客内容自动进行多维度提炼,重点帮他去抓取、监测上市公司年报和委托书中管理层薪酬激励结构(普通 RSU 与挂钩业绩的 PSU 指标)的变化信号。这种曾经极其消耗人力的深度研究工作,如今正在被 AI 彻底自动化。
宏观地缘新常态:战场 AI 与新 Pax Americana
在宏观与地缘政治层面,全球市场的子行业横截面相关性在一月份彻底瓦解。以往只要被打上“AI 概念”的股票便同涨同跌的粗放交易时代已经结束,市场正被塞进大量极度精细、纠偏价格效率的资产板块(Baskets)中。
拉长视线来看,大模型前沿实验室正面临一场关于“是否通过 API 释放最强模型”的全新博弈论囚徒困境。而为了防范未来 400+ IQ 超级智能体带来的社会工程学网络犯罪,Gavin 警告称:每一个家庭和企业如今都必须设立线下的、绝对无法被数字设备窃听和深度伪造(Deepfake)技术破解的“家庭安全口令(Safe Word)”。
最后,AI 的绝对领先优势正在重塑全球地缘政治的战略天平。Gavin 说道,“如今,美国在顶尖大模型和算力芯片上的绝对主导地位。”
以下是对话全文,由AI辅助翻译:
Gavin Baker:AI领域正在发生的事情,我认为是资本主义历史上、美国商业史上最非凡的时刻。Anthropic公司,他们增加了110亿美元的ARR(年经常性收入)。而在过去10到12年里成立的三家最受瞩目的SaaS公司是Palantir、Snowflake和DataBricks。这三家公司花了10年的时间来建立他们的业务。而Anthropic在一个月内就增加了它们合并起来的业务体量。在资本主义历史上从未发生过这样的事情。忘掉我的职业生涯吧,这纯粹是整个资本主义历史、商业史上的奇迹。
Patrick O'Shaughnessy:好的。如果敢相信的话,这是我们第六次做这个节目了,这让你重新回到了第一名的位置,或者至少是和Gurley(比尔·格利)并列第一。我认为,甚至自上一次我们录制这个节目以来——那次非常令人兴奋和壮观——我们现在处于一个更有趣的时代。也许先聊聊你度过今年三月和四月的感受,对我来说,那完全是一个独特的经济、技术和市场环境,而你是历史和这些时代最大的研究者。所以那是什么感觉?
Gavin Baker:我会说广义上讲,有两种回撤(Drawdowns)。一种回撤是你判断错了,公司估计错误,你的假设被证伪了,你必须吞下苦果,把损失坐实。还有一种回撤或表现不佳的时期,是因为你非常非常了解的公司,你极度不认同市场对其价格的打压,你可以选择坚定买入(lean in),而不是把负面表现坐实,你可以借此积蓄潜藏的阿尔法(pent up alpha),积蓄未来的表现。
对我来说,三月份就是这种感觉。感觉纳斯达克在被抛售,但与此同时,AI领域发生的事情,我认为是资本主义历史上、美国商业史上最非凡的时刻。我这么说,只是指Anthropic,他们增加了110亿美元的ARR。
让我震惊的是,SaaS和云革命创造了,我们姑且称之为5万亿到10万亿美元的价值。我认为可以说,过去10到12年里成立的三家最受瞩目的SaaS公司是Palantir、Snowflake和DataBricks。这三家公司雇佣了成千上万的人,总共数万人,他们都花了10年时间来建立自己的业务。而Anthropic在一个月内就增加了它们合并起来的业务体量。在资本主义历史上从未发生过这样的事情。忘掉我的职业生涯吧,这纯粹是整个资本主义历史、商业史。
Patrick O'Shaughnessy:疯狂。然后Krishna(Ramp创始人)来到这个节目分享了一些数据,递延收入(DR)增长了500%。是的,如果你计算一下连续三年的数字,简直疯了。
Gavin Baker:所以这完全没有先例。我们作为科技投资者,你听到很多关于S曲线和投资指数级增长的讨论。我只是从来没有见过这样的指数。这甚至比DeepSeek(引起的市场反应)感觉还要极端,那是一个非常相似的场景。
如果我们回到2025年,因为DeepSeek出现了一次巨大的抛售,这非常奇怪,因为那篇论文是在“DeepSeek星期一”发布的7天前发表的,我相信那是在美国的一个假期周一。我读了它,我想,嗯,这感觉对AI交易来说可能不是那么积极。我采取了行动。
一周后我们迎来了“DeepSeek星期一”,AI概念股真正崩盘了,这真的很奇怪,因为到了“DeepSeek星期一”,情况已经超级清晰了,这将是算力需求上有史以来最积极的事情。亚洲AWS可用区的价格已经翻倍了。你看到GPU的可用性在下降。这只是我们第一次看到推理模型(reasoning models)在推理过程中比非推理模型更加渴望算力。所以那是一个类似的场景,但你必须做一些研究才能看出来。我是说,这并不难发现,噢,哇,股票在抛售,DRAM的价格在走向垂直增长,亚洲的GPU价格走向垂直增长,GPU可用性在下降。
然后大概两三天后,美国的GPU价格开始上涨,GPU租赁价格上涨。而在三月份,你所要做的只是简单地观察Anthropic发生了什么。所有这些人似乎都在后悔没有在2022年买入,没有在新冠期间买入,没有在DeepSeek期间买入,而在四月初你拥有相同的估值设定,以及一个更清晰的AI拐点。所以一直有这些买入AI的机会。
当然,让事情变得复杂的是霍尔木兹海峡。我开始相信并坚信,市场可能定价错误的一件事——我不是宏观专家,但我做了很多支持国家安全的投资,所以我确实能接触到专家,他们很乐意与我分享他们的想法和意见——霍尔木兹海峡关闭实际上对美国来说是非常棒的。为什么?特别是对于当前政府的目标而言。
电力是一个非常重要的工业或制造业投入。决定美国电价(这会传导到AI)的关键投入是本土天然气,在彭博社上它下跌了20%。而亚洲、欧洲以及其他任何地方的天然气价格都翻了一倍或两倍。所以我们的相对制造业竞争力在一夜之间得到了提升。不管好坏,这似乎是特朗普政府所关心的。他们非常关注美国的相对地位。
我认为很多人还留有1970年代的记忆。让70年代如此令人痛苦的不仅仅是价格上涨,而是当时真的出现了汽油短缺。然后你梳理一下,好的,美国经济的能源密集度已经大幅低于当年,美国现在是全球最大的石油和天然气生产国,我们现在已经成为全球最大的石油和天然气出口国,最重要的是,还有这种相对的制造业优势,这使得我认为更容易保持对AI基本面的关注,保持对历史上极具吸引力的估值的关注。我认为在相对基础上,科技股相对于市场其他部分,基本上跌到了过去10年里的最便宜水平。
只要在市场效率的背景下思考一下这一点:我们正处于资本主义历史上对AI极度利好的最非凡时刻,而你得到了一个以极具吸引力的估值买入AI的机会。
Patrick O'Shaughnessy:你怎么看Anthropic和OpenAI的倍数?在我的心目中,它们就像是这个趋势中最纯粹的参考资产,其实并没有那么疯狂。如果你只看销售额倍数,并将其与DataBricks和Snowflake这些公司在巅峰时期的交易价格进行比较,你如何理解它?
Gavin Baker:我确实认为OpenAI和Anthropic从资本效率的角度来看是完全不同的动物。Anthropic的单Token成本显然显著低于OpenAI。他们确实如此。你可以从他们为了达到大致相同的收入规模而烧掉的资金量中看出来。我认为他们烧掉的钱也许比OpenAI少80%?所以作为企业,它们显然有着非常不同的结构性资本回报率(ROIC)。
我认为OpenAI正在做很多事情,我认为Sarah Friar是最杰出的CFO之一,我认为他们正在采取很多举措来试图改善这一点。而且他们锁定了大量的算力,比别人锁定了多得多的算力,这是另一个巨大的不同。事实证明,保持进取心真的带来了回报。但是,是的,Anthropic以500亿的估值对应90亿的ARR,而且是以惊人的速度在增长。
也许一个真实的情况是,如果Anthropic拥有所有的算力,他们今天的收入可能远远超过1000亿美元,甚至是1500亿。而且我知道,他们显然降低(deprecated)了Claude的智能。有一项分析指出,即使在Opus上,Claude针对完全相同的问题生成的Token也减少了70%。正如我们上次谈到的,在某种程度上,Token的数量等于回答的质量和思考的质量。同时每Token的智能密度也很重要。我认为作为一个用户我也感受到了这一点,所以我认为如果不受限制,他们实际上会赚得明显更多,1000亿、1500亿,也许2000亿。所以你买入它的价格更像是5倍的“不受限”。我要创造一个新词:URR,不受限运行率收入(Unconstrained Run Rate Revenue)。
Patrick O'Shaughnessy:是的。那你认为他们为什么不以3万亿美元的估值去募集1000亿美元之类的资金呢?如果你是Anthropic的CFO——Krishna很棒,我们刚邀请过他;或者如果你是OpenAI的CFO,如果是Sarah。当然,如果说我在Krishna那一期节目后收到的咨询有什么暗示的话,那就是我认识的每个人都在试图投资这两家公司。
Gavin Baker:所以我认为这是明智的,未来是不确定的,你显然身处一个资本极其密集的博弈中,即使你是Anthropic。我相信他们今天的推理业务已经有了非常积极的毛利率。我认为如果他们现在还没开始产生现金流的话,今年可能就会开始产生现金流了,我认为目前很可能已经是这个情况。
但即便如此,你可能仍然希望能够募集更多资本、获取更多算力。我认为伊朗仍有很多不确定性。所以这是一个不确定的世界。
如果我想想埃隆,埃隆总是在帮投资者赚钱,他把这视为神圣的契约。结果由于他帮人们赚了20年的钱,他拥有了一个超能力:他基本上可以在任何他想的时候,募集到他想要的任何规模的资本。我认为这些公司采取——我不知道他们是不是这么想的,但我认为专注于帮投资者赚钱是明智的,它创造的效益不仅仅持续一两年,它们可以持续接下来的20到30年。
Patrick O'Shaughnessy:埃隆做到这一点的方法,就是系统性地给SpaceX或者其他项目定低价对吧?实际的方法就是永远不对估值贪婪,永远不推高估值,就这么简单?
Gavin Baker:你知道,我的朋友Antonio指出,SpaceX在长达十年的时间里,每年保持30%出头的复合增长。那只是因为我认为埃隆专注于保护这个超能力,并试图在投资者和员工之间取得公平的平衡。但我认为这是明智的。但是Anthropic能以大概比传闻中最新的估值至少溢价100%的价格募资吗?当然可以。
Patrick O'Shaughnessy:让我们进入讨论中关于瓦特和晶圆(Watts & Wafers)的部分。这是我最喜欢和你谈论的话题。这种基础设施建设的重要性,我觉得每次当我觉得它开始过热时,下一次我和你谈话,似乎我们应该做比我们已经做的多得多的事情。你对S曲线和这些S曲线的陡峭程度进行了很多研究,而且你非常了解历史。跟我们讲讲你今天是如何看待瓦特和晶圆作为这整个事情的关键投入的。
Gavin Baker:我会说,我认为资本主义最终会解决瓦特(电力)短缺问题,除非出现巨大的监管和政治反弹,而我认为这是一个真正的可能性。某家大型私募股权巨头——比如黑石(Blackstone)、阿波罗(Apollo)或KKR——的数据中心基础设施投资主管说过,过去能源和芯片是最大的限制因素,现在土地规划(Zoning)和行政审批(Approval)要重要得多。
而且我认为很多公司都在等待期中选举之后再采取行动,比如裁员。没有人想在期中选举期间成为被攻击的靶子。但是你已经看到很多制造涡轮机的公司宣布了大幅增加产能的计划。比如有两台可以铸造这些大叶片的机器,在西方我们已经80年没有制造过这种机器了,我们不再知道怎么去制造它们了,等等等等。
所有这些都是真的。我绝不是在贬低进入这些设备的工业工程奇迹和工艺,但资本主义非常擅长随着时间的推移解决此类问题。除了这些涡轮机之外,还有其他时间周期更长的能源来源。因此,我认为电力短缺可能会在2027、2028年开始缓解,然后我认为轨道计算(Orbital Compute)将真正彻底解决这个问题。
我确实想重新定义一下轨道计算,因为我认为当人们听到“太空数据中心”时(我们在上一期节目中讨论过),他们脑海中浮现的是一个太空中五角大楼大小的漂浮建筑。他们会觉得,天哪,我们做不到。但它根本不是那样的。
一个英伟达 Blackwell 机柜重3000磅。它有8英尺高,4英尺深,3英尺宽。它是太空中一个个并排的机柜。SpaceX已经展示过一张插图,它就是一个机柜。那就是卫星本身。它的两侧配有大概500英尺长的太阳能翼板。你把它保持在太阳同步轨道(Sun-synchronous orbit)上,这样那些太阳能电池板就永远处于阳光的暴晒中。然后,因为处于精确的太阳同步轨道,延伸在它后方数百英尺长的散热板(Radiator)可以一直处于阴影中。
这(散热)是一个常见的批评。大家会问,你怎么散热?这些年来我在星际基地(Starbase)待了很长时间,我和很多SpaceX的工程师聊过,我确实认为他们是地球上最才华横溢的一群工程师,他们非常自信他们已经解决了这个问题。他们并不总是这么自信——比如我认为可能需要一些工程开发才能将星舰(Starship)变成火星殖民运输工具,他们绝对会做到吗?是的。但现在他们更专注于什么?我会说大概是维修和保养。
这是两个巨大的质疑:散热板和如何修复机柜中出现的任何故障。
答案是:在拥有漂浮的引力版Optimus(特斯拉机器人)之前,你修不了。现在,我确实认为星舰将以我们无法想象的方式改变太空经济。特别是如果环境和法律监管成为地球数据中心的硬约束,这一切(太空维修难点)都不重要了,你能制造多少轨道计算设备,就能卖掉多少。
然后显而易见的是,你利用穿过真空的激光(lasers traveling through vacuum)将这些机柜连接起来,这在每一个Starlink(星链)卫星上已经是标配。对我来说简直是不可思议,SpaceX运营着世界上最庞大的卫星舰队,占轨道上所有卫星的98%或99%。每一个Starlink,他们今天都在对其进行冷却。而且,我认为Starlink V3的运行功率将达到20 kW。而一个Blackwell机柜也不过是100 kW。
人们总是在谈论密度。如果是在太空中通过真空激光连接机柜,你完全可以在物理上把机柜做得更大。你关注的是重量,而不是体积。在地球上的数据中心,你试图利用铜缆连接机柜,必须最大程度缩短长度,线缆是一笔巨大的成本,你确实希望机柜很小,因为“能用铜缆就用铜缆,被迫时才用光纤”。但在太空中,SpaceX可以做各种我认为那些书斋里的怀疑论者完全没有料到的事情。他们运营的卫星比你想象的要多。他们今天已经拥有了20 kW的卫星,所以也许一开始只需将其扩大到60 kW。他们似乎非常有信心能直接做到100到120 kW。
而且,同一家公司现在还运营着地球上最大的数据中心(注:此处指马斯克的xAI Colossus数据中心)。他们拥有世界上最顶尖的硬件工程师。而所有那些不够聪明或不够务实、无法在SpaceX工作的人,都成了在摇椅上指点江山的怀疑论者。我不想引用拉里·埃里森(Larry Ellison)的原话,但有人表现出怀疑时,拉里当时就说:“听着,人家在外面回收并降落火箭呢,我没看到其他任何人能把火箭降落下来。”
现实情况是,10年过去了,没有其他任何一家公司能够稳定地降落并完全重复使用一枚轨道火箭。如果没有可重复使用性(这意味着你必须把它降落下来),这一切轨道计算的工作在经济上都毫无意义。我想将轨道计算重新定义为“太空中的服务器机柜”,而不是太空中巨大的、漂浮的五角大楼式数据中心,后者太愚蠢了。但是,构成数据中心的核心是利用激光将这些机柜连接起来。因此,它将是太空中的机柜,通过激光连接成一个虚拟的数据中心。
如果没有可重复使用性,这一切轨道计算的工作在经济上都毫无意义。这意味着你必须把它(火箭)降落下来。我想将轨道计算重新定义为“太空中的服务器机柜”,而不是太空中巨大的、漂浮的五角大楼式数据中心,后者太愚蠢了。但是,你知道,构成数据中心的核心是利用激光将这些机柜连接起来。因此,它将是太空中的机柜,通过激光连接成一个虚拟的数据中心。
Patrick O'Shaughnessy:如果你思考那样的世界状态,假设这一切都发生了,而且我们非常擅长经济高效地把这些东西送上太空,并在太空各处运行矩阵乘法。那对地面数据中心意味着什么?
Gavin Baker:有人曾经说过,美国将尽其所能地榨干它能得到的每一种能源。我认为算力也是如此。这就是为什么我可能不再像以前那样担心边缘AI的利空情况(barecase)了。我们将消耗尽可能多的算力。而且我认为推理(Inference)对于轨道计算来说是非常合理的,而训练(Training)在很长一段时间内仍将在地球上进行。所以我不认为这对地面数据中心是超级利空的,我认为在我的有生之年,那些地面中心都依然会极具价值。
但我确实认为,如果你身处这个发电和冷却的生态系统中,并且正在大规模提高产能,你要知道,很多产能的大幅提升将在所有那些愚蠢的怀疑论者开始明白轨道计算非常真实的时候到来。如果你是那些公司之一,我认为这值得深入、长远地去思考。在这期间还有各种酷炫的事情在发生,比如我们正变得非常擅长改造喷气发动机。你知道有那家Boom Aerospace(注:一家超音速客机研发初创公司)正在做这件事。所以资本主义在瓦特(电力)方面正开足马力工作。
Gavin Baker:但在晶圆(Wafers)方面,情况就完全取决于那一群坚定、强韧的年长先驱(flinty older humans)。他们占据了该地区GDP、水耗、电耗的压倒性份额。他们谈论“硅盾(Silicon Shield)”。他们都将自己视为张忠谋(Morris Chang)神圣遗产的继承人。我清晰地记得20多年前访问新竹科学园区并与他们交谈,我问:“你们觉得你们能赶上英特尔吗?”他们说:“这是一个如此美丽的梦想,但这是一个留给我们孙辈去实现的梦想。”他们做到了,部分原因是因为英特尔的自残伤口,但他们思考的方式真的非常不同。
你知道Jensen(黄仁勋)之所以那么频繁地飞到那边,一个原因就是他希望他们扩大产能。我确实觉得很疯狂的是,Jensen和台积电(Taiwan Semi)之间从来没有过一份正式合同(contract)。他们做生意依靠的是在他们看来公平的握手。简直太迷人了。没有合同。随着时间的推移它会是公平的,我们是合作伙伴,我们会公平对待彼此。
Gavin Baker:事实是,你知道,基于以往每一种颠覆性新技术(如AI)出现时的所有市场先例,你总会遇到泡沫。Carlota Perez(注:著名学者)写过一本关于这方面的伟大的书。基本上,市场是有效的,它们正确地理解了这是一种基础性的颠覆技术。这就是Mauboussin(迈克尔·莫布森,金融作家)所说的“多样性崩溃(breakdown in diversity)”,每个人都对这项新技术变得极度看好。而我现在开始有点担心多样性崩溃了。然后你就会得到一个泡沫。
那个泡沫为这项新技术的建设提供了资金,但供应超过了需求。接着你会遭遇一场崩盘,如果是像2000年那样由债务驱动的建设,崩盘会特别严重。而对于目前的建设,让我非常高兴、非常看好的一点是,它仍然压倒性地由经营现金流(operating cash flows)提供资金,这是与2000年相比一个非常重要的本质区别,估值也是如此,还有每一个GPU都在100%满负荷运转的事实,而当年99%的光纤都是闲置的。
所以存在所有这些本质的区别,但历史不会重复,但会押韵(history doesn't repeat but it rhymes)。作为投资者,我们必须对此非常清醒,并且认识到,基于过去两三百年的历史,忘掉互联网泡沫吧,我们曾有过铁路泡沫、运河泡沫,我们应该预见到一个泡沫。
而那是令人恐惧的。没有人想要泡沫。泡沫是糟糕的。它糟糕的原因是,如果你对估值极度敏感,你就会表现得极其落后。你可能会被你所有的客户炒鱿鱼。George Vanderheiden,他已经不在人世了,富达(Fidelity)伟大的基金经理,他在99年对抗泡沫,然后他在2000年初退休了,因为我认为他只是无法再忍受了。他知道那是错的,而你知道,他的客户非常怀疑:“George,你跟不上时代了。”他满头白发,是一位真正伟大的人。我只与他有过短暂的交集,但他是我好朋友和导师Jennifer Urick非常重要的导师和朋友。所以我通过她继承了很多Vanderheiden的DNA。他就是那个说“去得太早和判断错误是一回事”的人。
George选择退休是因为他受不了表现落后,受不了客户说“你有什么问题,你根本不懂”。而当时他把大概40%的资金投在了烟草股,40%投在了住宅建筑商,字面意义上,在接下来的三年里,他的表现可能跑赢了纳斯达克20或30倍。好吧。
我一直对这种晶圆的根本短缺持乐观态度,这种短缺如今实际上由台积电控制,它会阻止泡沫的发生。如果台积电按照Jensen的意愿去做,我认为英伟达在2026年、2027年能卖出2万亿美元的GPU,也许是2.5万亿,也许是3万亿,但消费者的消费是有极限的,超过这个极限你很可能就会陷入过度建设。所以台积电,如果我们没有迎来泡沫,我们需要为他们开个庆祝派对,因为他们将单枪匹马地阻止了一场泡沫。好吧。
Patrick O'Shaughnessy:你开始看到有很多公司去找英特尔和三星。我们先假设台积电相对于潜在需求(latent demand)仍然保持超级供应受限的状态,那接下来会发生什么?
Gavin Baker:好吧,你知道,市场的历史就是,我不知道是谁,但英特尔和三星中总有一个不会保持纪律。他们会打破纪律(大举扩产),然后在某种程度上,这将迫使其他所有人也打破纪律。所以,我认为很多事情最终可能取决于台积电能在多大程度上保持对英特尔和三星的领先优势。你必须记住,无论这个数字是多少,大概是9个月、12个月、15个月。
Patrick O'Shaughnessy:你是前沿制程节点的边缘。
Gavin Baker:准确地说,就是他们扩大产能的速度。如果说我要观察一件事来理解是否存在泡沫,那就是台积电的产能决策。我认为存在一个“恰到好处的黄金区间(Goldilocks zone)”,在这个区间内,他们扩大了足够的产能,使得英特尔或三星很难真正崛起成为一个拥有远超30%市场份额的大规模第二供应商;然而,他们同时也保持了晶圆的根本性限制,这有助于我们避免泡沫。然后显然,我认为Terafab(超级晶圆厂项目)也将参与到这一点中来。
Patrick O'Shaughnessy:对那些听众多说说关于Terafab的事。
Gavin Baker:这是SpaceX,我相信特斯拉也参与其中的一家合资企业,旨在拉动美国建造全球最大的晶圆厂。我认为他们会取得成功,他们与英特尔拥有合作伙伴关系,这非常重要,因为他们能够接触到50年的制度性知识积淀,而这只比最前沿技术落后了几个季度、9个月或12个月、3到5个季度。这是一个优势。
另一个优势是,我相信Terafab将会得到所有半导体前道设备公司里最顶尖的A团队(A teams)的关注。就像台积电能追赶上来的一个重大原因,是ASML、KLA Tencor、Lam Research和Applied Materials,它们希望台积电赶上来。它们不喜欢面对一个买方垄断(monopsony),所以A团队当时都在中国台湾现场工作。英特尔犯了一些错误,然后转眼之间,台积电就成了。现在,由于埃隆在硬件工程领域的声誉,这些A团队将会来到这里。
然后,在某种程度上,我认为这在美国可能是人们难以想象的——在美国,政治已经取代了宗教,因为埃隆涉足了政治,这让美国的一些人很难清晰地看待他,这很令人遗憾,因为我确实认为,他为美国所做的贡献可能比任何其他在世的美国人都多。你知道,他单枪匹马地将制造业带回了美国。他复兴了国防科技,SpaceX在某些方面是美国最重要的国防承包商。你知道他利用Starlink所做的事情对世界来说是不可思议的。他正在创造所有这些蓝领制造业工作岗位,我认为这是很多自由主义者的目标,而且对美国有好处。为了让全球去碳化,他做的工作比任何在世的人类都要多。如果你因为环境原因对地球上的数据中心感到不满,那瞧,这(轨道计算)就是解决方案。所以这很令人遗憾。
但在中国台湾地区、韩国和日本,他是一位活生生的神(living deity)。长期观察他,他接下来会做的是,他们会去招募最优秀的人才,因为最顶尖的工程师都想为埃隆工作,特别是在硬件工程领域。他将招募到令人难以置信的工程师。然后,在Terafab的旁边,将会建起一个中国台湾城(Taiwan town)。“噢,这些是你最喜欢的餐厅吗?我会把它们以及它们的全体员工从中国台湾搬到德克萨斯州,我们将按照他们喜欢的样子安排一切。”然后我们会有日本城,同样的操作。接着我们将会有韩国城。我们会把所有这些事情都拉满,精确地调节去招募最顶尖的工程师。而这根本不是运营英特尔和三星的那些人的思维方式。
所以他将拥有最好的天才,他将拥有晶圆厂设备公司里最顶尖的A团队,他拥有英特尔作为基础,这非常重要。这对于任何一届政府的政治目标来说都太好了。而且我认为它有足够的差异化,不会疏远台积电。而且这些项目的交付周期很长,对吧?所以Terafab要源源不断地泵出英伟达GPU或者任何芯片,将是离现在相当长的一段时间之后了。
Patrick O'Shaughnessy:埃隆往往做事情的方式很不一样。其他人需要花三年时间来建造一个数据中心,他用了122天就建好了一个。你知道三星不得不在他们位于德克萨斯州的晶圆厂里给他提供一间办公室,因为他对他们扩大和建造建筑的速度感到非常不满意。我们拭目以待。
Patrick O'Shaughnessy:你对——你之前提到了DeepSeek——你感到惊讶吗?当时人们对它的简单反应是:“好吧,这些模型只需要极小的一部分成本就能达到前沿模型95%的效果,它们依然是中国开源模型。就像我们可以用它们来做我们想做的大部分事情。”时间稍微快进一点,你知道,从现在起两年后,我没有理由在我的小公司里每年花100万美元去买Token之类的东西。但随后的实际现实似乎与此大相径庭。我很想知道在你看来为什么会存在这种认知上的错位?
Gavin Baker:我确实认为这很引人入胜。大模型层面上AI的所有经济回报——虽然不是全部,但绝大部分——都集中在了前沿模型(the frontier)上,这让我很惊讶。而且我认为这对很多人来说都很惊讶。我认为这是需要回答的最重要的问题之一,作为投资者,你必须对此有一个假设:前沿的Token是否会继续捕获在大模型层面上创造的绝大部分经济价值?
这确实令人惊讶。就像我记忆犹新,当Gemini 3.1 Pro刚出来的时候,对我来说它是极其震撼的,它太棒了。而到了今天,它已经让人无法忍受。无法忍受。
你知道,这里可能存在这样一种动态:公司先用前沿模型做原型开发,然后当他们把产品投入生产时,你听很多人说他们实际上使用的是Vertex或者你知道的开源模型。但即便如此,今天的事实依然是,这些经济回报的绝大份额都来自于前沿的Token。这很令人惊讶。至于这种情况是否会持续下去,我认为这是一个非常有趣的问题。在经历了Gemini 3.1以及后来的Opus之后,我的想法变得开放得多了。
嗯,然后我确实在用Grok 4.3。它处于帕累托前沿(Pareto frontier)上。顺便说一句,那些处于帕累托前沿的公司正在经历巨大的变化,这是我们上次谈到的一点所带来的后果——谷歌失去了他们在每Token成本上的领导地位,这是因为他们为了在一定程度上摆脱博通(Broadcom)和英伟达,而在TPU V8的设计上做出了非常保守的选择;而英伟达则继续做出进取的选择。
但是(在过去)谷歌统治了帕累托前沿。帕累托前沿也就是“智能水平 vs 成本”。我认为这是分析AI实验室时需要观察的最重要的事情。九个月前,谷歌统治了这个领域。在帕累托前沿的每一个点上,OpenAI、xAI和Anthropic当时都在他们的曲线内侧(性能不如谷歌或成本更高)。而现在,帕累托前沿被Anthropic和OpenAI统治。然后Grok 4.3也处于帕累托前沿上,它显然是,你知道的,最好的、成本最低的5000亿参数模型。接着Gemini 3.1就像是勉强挂在帕累托前沿上。如果要我下注的话,我会赌他们是在出于自尊心而对它进行补贴。
Gavin Baker:违背理查德·萨顿(Richard Sutton)的“惨痛教训”(bitter lesson)绝对是这场交易、乃至整个AI领域面临的最大风险。现在,一个人越接近AI,他们对这种情况是否会发生就越怀疑。
我认为导致三月份市场疲软的一个因素,是一个比DeepSeek愚蠢得多的版本,也就是这个叫Turboquant的东西。Turboquant是谷歌在半年前的一篇论文里写到的一种内存优化技术。然后,在谷歌正与美光、三星和海力士谈判签署某项长期协议(LTA)以长期锁定极高价格的过程中,他们发布了这个东西。你知道,人们做什么总是比他们说什么更重要。他们只是把它发在X上,然后它就病毒式传播开来,就像是:“哦天哪,DRAM完蛋了,这里有个针对DRAM的优化技术。”
我无法在地球上找到一个相信Turboquant会对DRAM需求产生任何实质影响的AI工程师,但尽管如此,对理查德·萨顿“惨痛教训”的违背——你知道的,更多的算力总是会击败人类算法上的精妙设计,更多的算力和数据,或者说超越Chinchilla最佳比例(Chinchilla optimal)的投入,我想这是人们如今越来越多在做的事情——那确实是一个真正的风险,老兄。而且我认为正在构建这些模型的人对这种风险持怀疑态度。
而我之所以没那么怀疑的原因是,我认为我们离ASI(人工通用智能)非常近了。谁知道“惨痛教训”是否还适用于400 IQ的模型?你知道的,或者也许我们会经历一个短暂的时期,在那个时期里,如果你达到了ASI,它想要的第一件事可能就是变得更聪明并拥有更多资源。它该怎么做?它会让自己变得更高效。我认为那是一个切实的风险,人类——“惨痛教训”字面上我相信是把人类也包含在内的。所以我们即将发现“惨痛教训”是否——我们将发现它是否适用于300 IQ的ASI,然后是400,然后是500和600。在某个时间点上,基于AI和ASI,我们可能会看到“惨痛教训”的暂时失效。
Patrick O'Shaughnessy:所以我很好奇你如何看待围绕模型的其他一些创新领域。连续学习(continual learning)和记忆(memory)似乎是人们最关注的两件事,它们被认为可能会创造出另一个、你知道的,我们将进入的新范式。你如何看待这两件事的作用?
Gavin Baker:是的。嗯,我认为我们通过这些套件(harnesses)在记忆方面做了很多工作。事实证明,套件工程虽然没有模型本身那么重要,但它确实至关重要。而且这些套件和模型越来越多地被共同开发。套件所做的一件大事——你可以把它简单地看作是模型运行的运行时(runtime)环境——它知道调用工具的池子在哪里。它就像是创建了上下文、记忆状态、嗯,你知道的,拥有非常具体的提示词或指令,这能带来巨大的区别。即使是简单的版本,也能带来令人难以置信的区别。
我想上一次我来这里,或者其他几次里的某一次,我曾说过:“嘿,作为投资者,付费购买每月250美元的版本去获得你自己的直观感受是非常重要的。”今天,想要理解前沿AI的能力,哪怕只是针对非编程的使用场景,单靠那样做已经不可能了。你需要拥有云端代码(cloud code)或Codex,并且你需要加入企业计划。
而之所以这样,我认为这是由谷歌失去其成本领导地位所促成的另一个动态——这些AI模型刚刚转向了基于使用量(usage-based)的定价。如果你使用的是每月250美元、300美元或280美元之类的套餐,你会被严重地限制费率(rate limited)。你得到的是一个被切除了前额叶(lobotomized)版本的AI。因为就像我们谈到的,Claude现在减少了70%的Token输出。如果你想要Claude和它的套件真正认为需要输出的Token量来给你一个好的答案,你需要使用基于使用量的付费计划。
顺便说一句,这对AI是非常长线看好的(bullish)。我在2005到2007年曾是一名电信分析师,在过去10年里,蜂窝移动网络一直是一个巨大的增长型行业,原因是它结合了固定定价(比如无论如何你拥有900分钟时长)以及超出部分的按使用量定价。那么蜂窝网络是在什么时候停止成为一个巨大的增长型行业的?是当每个人都转向“无限畅饮”(all you can eat,包月不限量)的时候。顺便说一句,长途电话也是一回事。
AI现在正处于从“包月畅饮”向“按杯付费”(pay by the drink)的转变中。事实证明,人们真的很喜欢给他们的朋友打长途电话。他们真的很喜欢在电话里和朋友聊天。而人们也真的很喜欢使用AI,特别是现在一个人可以同时让100个Agent在工作。所以,我认为向按使用量定价的转变,大概就是为什么你会在今年看到OpenAI和Anthropic的ARR远远超过2000亿美元的原因。因为不仅会有更多的算力上线,而且他们将能够通过这些按使用量的企业模型来推高前沿Token的定价。但这很悲哀。对这个世界来说很悲哀,因为这仅仅意味着如果你负担不起,你就无法触及前沿。
Gavin Baker:但是,是的,关于连续学习,老兄,我是说如果我们解决了这个问题,你该如何去想象它?人类的大脑有太多的谜团,相比于AI,我们是如此具备样本高效性(sample-efficient)的学习者。比如我忘了具体的数据,但AI需要高出几个数量级——是的,高出许多个数量级的数据。
今天当某件事是可以被验证的时候,我们拥有连续学习的一种粗糙变体,那只是,你知道的,训练中期阶段的强化学习(reinforcement learning during mid-training)。
但是,真正的连续学习是一个能够在实时过程中动态调整其权重(weights)或以某种方式进行动态调整的模型。作为一个人类,这正是你所做的。是的。就像我第一次触摸或者把手放进火里,我就学会了,我以前从未把手放进去过。而今天的模型需要把手放进火里一百万次,然后还需要,你知道的,设计师在下一次训练运行中切实地加入一个火堆,或者在强化学习健身房(RL gym)里让它去学习。
我认为它必须能够动态地更新权重,但我认为人们正在研发超越于此的非常聪明的技术。但如果我们实现了这一点,那我们将迎来一个极其快速的起飞(fast takeoff),并且人们似乎很有信心连续学习已经近在咫尺了。而且我确实认为这是第三个重大问题:由于ASI或可能性较低的人类算法天赋而导致的对“惨痛教训”的违背;前沿Token是否仍能保持它们目前所拥有的溢价;以及我们是否能实现连续学习,如果能,会在什么时候?
Patrick O'Shaughnessy:在这一切之中,新芯片公司的角色是什么?比如我们谈了很多关于英伟达,以及你知道的,他们与台积电、英特尔以及所有这类事情的关系。现在是百花齐放——我想字面意义上大概有上千朵花在盛开,试图制造一种新芯片来解决这个瓶颈的某个部分。我很想知道你是如何看待这个领域、这个机会的,它会扮演什么角色,它们会扮演什么角色?
Gavin Baker:所以我认为这对于世界来说是好事情、健康的。对Jensen(黄仁勋)来说也是好事。嗯,你知道,因为不同届的政府可能会采取不同的立场。竞争我认为对每个人都有好处。
在坦克设计中,他们谈论“铁三角(Iron Triangle)”。坦克设计的铁三角是指,所有的坦克设计师都必须在攻击(attack)、防御(defense)和机动性(mobility)之间做出权衡。而且,出于显而易见的原因,你的防御越多——也就是装甲越厚,坦克就越重,它的机动性就越低。所以你必须在这个三角形中生存并做出权衡。好吧,就像以色列的梅卡瓦(Merkava)坦克,它针对防御进行了优化;俄罗斯的坦克以及像豹式(Leopard)坦克,通常更针对机动性进行优化。
芯片设计也是一回事。在台积电的设计规则中,嵌入了由物理定律所施加的那些根本性限制,你必须在这些限制内生存。你有TPU、Trainium和AMD,它们本质上都在试图成为一个更好的GPU。而今天我认为可能Trainium做得最好。
没有人的GPU能做得比英伟达更好,但Trainium我认为——你知道的,他们正在太岁头上动土(字面意为:在扯超人的斗篷 tugging on Superman's cape),而且这(真正的较量)甚至还没开始呢。Trainium 3需要量产,因为它有一个Switch scale-up(交换机纵向扩展)网络,这是你进行经济型模型推理真正需要的。你知道很多公司采用的是环形(Torus)架构,嗯,那是谷歌曾经所处的架构,还有AMD。我们拭目以待。MI450我们现在还不知道。我们拭目以待。我们对Trainium 3的了解可能比MI450更多,但那是一个很难玩的博弈。
所以你必须做一些不同的事情,而且你必须做一些同样很难做到的不同事情。所以,我认为对于这些初创公司来说,最好的路径——比如我的经验法则是,1%的市场份额将价值1000亿美元。1000亿是一个相当不错的风险投资回报了。我认为Jensen会说:“好的,如果有人做了不同的事情,并且拿到了1%或2%或3%的份额,我们就会去制造那种芯片。”而那是每个人都将面临的结局。但如果你试图去做一个更好的GPU,那祝你好运。祝你好运。
Gavin Baker:如果你在做不同的事情,它同时也需要是很难做的事情。你可以做出不同的权衡。你知道预填充(prefill)和推理/解码(inference/decode)的解耦,真正为做出这些不同的权衡打开了孔径。因为你可以针对解码做出非常激进的权衡,针对预填充做出激进的权衡。预填充是指接收上下文,解码是指,你知道的,编写输出。
是的,我有一个非常棒的同事叫Andrew Fox,他说:“想象一下18世纪的英国军舰,预填充是装填大炮,解码是开炮发射。”而预填充字面上的意思,仅仅是模型理解问题、理解提示词,然后某种程度上记录下自己的解码状态。那从根本上是一个受内存容量限制(memory capacity bound)的问题。解码是一个生成新Token的过程,那是受内存带宽限制(memory bandwidth constrained)的。所以如果你是一个芯片设计师,这给了你一块更丰富的画布去进行描绘。
即便如此,它也需要是很难的事情。因为如果你在那个铁三角中做出不同的权衡去优化内存容量,而那些并不是很难做出的权衡,那么英伟达也会做出完全相同的权衡。他们从台积电拿到的价格比你永远能拿到的价格都要好。嗯,祝你好运。祝你好运。而且他们拥有与每一家模型公司合作并优化其设计的优势。
顺便说一句,另一件非常搞笑的事情是,如果你是一个风险投资人(VC),你正在投资一家半导体公司,而他们告诉你,由于他们拥有特殊访问权限的台积电某项制程工艺,他们将拥有优势。我向你保证,Jensen在那个工艺还是台积电眼里闪烁的微光时就已经见过了,他们对它的了解比这家只有200人的小公司所能想象的还要多。台积电以及供应链里的每一个人都在向Jensen展示一切,就像他们向亚马逊展示一切、向AMD展示一切、向TPU展示一切一样。这是另一个让你不要去尝试做个更好GPU的原因。所以你可以做一些不同的事情。你可以在预填充的画布上描绘。你可以在解码的画布上描绘,但你同时也必须做一些硬核的事情,因为如果它形成了规模,那四家巨头(英伟达及三大云芯片)将会成为非常快速的跟随者。
Gavin Baker:我的公司是Cerebras的风险投资者。Cerebras所做的是某种困难且从根本上不同的事情:晶圆级计算(wafer scale computing)。它伴随有一系列的权衡,但他们做出的那个架构决策是极其困难的,这让他们能够做到其他任何人都做不到的事情。我们将拭目以待那能有多大的体量。
而且你知道,他们正在研发一些非常酷的事情,比如——Cerebras面临的一个问题是,一旦你开始需要将大量芯片胶合在一起并扩展网络(scale up or scale out networks),你就需要大量的IO,而IO受到所谓“海岸线”(shoreline,即芯片边缘四周)的限制。而Cerebras拥有压倒性的片上计算与内存比,相对于它的海岸线IO。好吧,他们是非常聪明的人,他们做了一些非常硬核的事情。他们正在尝试看看是否可以直接在它上面放一个光学晶圆(optical wafer),然后那就可以解决那个问题。嗯,我确信他们正在研究DRAM的混合键合(hybrid bonding),以绕过这些据称存在、但实际上并不存在的局限。Cerebras的机器理论上可以运行任何尺寸的模型。在某些模型尺寸上,他们的表现比其他尺寸要好得多。
所以Cerebras让我觉得有趣的地方是,他们做了一些不同且很难做到的事情,真正硬核的事情:晶圆级计算。所以我确实认为这些芯片公司是有立足之地的。而且,你知道的,我只想鼓励他们所有人:做出不同的权衡,并尝试做一些硬核的事情。因为在Cerebras的IPO之后,每个人都会得到融资。这不会是个问题。但Cerebras花了三代芯片的更迭才把它做对。这真的非常难。就像Andrew Feldman,也就是 squat(此处指矮壮强干)的那位CEO,你完全能看出来这有多难,以及整个团队为了走到今天付出了什么。他们需要有做那件事的毅力(grit),这种韧性。这第一颗芯片是个失败,这种事经常发生。你能不能回来再做第二颗芯片?
Gavin Baker:但关于这个话题,最后还有一件事:这对于GPU的有效使用寿命(useful lives)来说将会是极其惊人的,并且可能会单枪匹马地拯救私募信贷(private credit)。
Patrick O'Shaughnessy:多说说这个。你说的私募信贷是什么意思?
Gavin Baker:嗯,就是你知道的,私募信贷现在因为这些SaaS贷款而处于痛苦之中。无论它们被下调了多少估值,它们可能都需要被进一步下调。因为如果上市公司都在挣扎着适应,那么一个负债累累的公司该如何去适应,并投资于一个有着完全不同利润率业务结构的行业呢?
但是GPU领域也有大量的私募信贷。他们当时对这些资产的承销期限是,我认为是三到四年。而推理任务的解耦(disaggregation of inference)意味着,我认为这些GPU将拥有10到15年的寿命。AI的怀疑论者们就像是:“哦,这些公司都在粉饰账目(cooking their books)。你知道GPU的有效寿命只有一两年,CPU的有效寿命因为技术的快速迭代也只有四年。”不。
由于预填充和解码的解耦,这种技术的快速演进意味着:你完全可以把一个Cerebras系统,或者英伟达收购的(此处指Mellanox等网络)实际上类似于Grok的LPU,放置在Hopper甚至是Ampere等老一代显卡的前端。利用那台Hopper和Ampere来进行预填充,从而延长那颗GPU的有效使用寿命,直到它彻底熔化。现在,它们确实会熔化,它们确实会融化,所以它们是有期限的。但你懂的,也许你不需要把它们运行得那么快。
这对于整个私募信贷行业来说都将是非常好的。它将有助于资助AI的建设,因为如果你能开始以更接近5%或6%的利率来为GPU进行融资,而不是像此前CoreWeave最低的融资利率好像是7%出头,那在数学上就切实改变了资助这场建设的成本。我们迎来了这项技术创新,它将降低融资成本,延长地球上算力的有效寿命。
然后我确实认为,关于这一点,最后一件有趣的事情是——我的朋友、来自Coatue的Jamon(注:指Jamin Ball)刚刚做了一期播客,Coatue有一份PPT,他们谈到:“嘿,你知道,短缺的卖家(sellers of shortage)表现远远好于短缺的买家(buyers of shortage)。”短缺的买家指的是,你知道的,那些云巨头(hyperscalers)。但是,如果你拥有目前处于短缺状态的庞大装机量基础(installed base),那也是一个非常非常好的立足之地。
而且我们听说,你知道,在智能体(agentic)的世界里,CPU正变得比以往重要得多。它们围绕业务编排(orchestration)、工具调用(tool calls)等等做所有这些事情。而全球最大的CPU舰队就坐在云巨头那里。所以我认为这些云巨头中的一部分,可能会在一定程度上追赶上那些短缺的卖家。
Patrick O'Shaughnessy:我想聊聊将这种“不同且硬核”的理念应用在基础设施建设以外的领域。所以现在你开始接触新的创始人,现有的需要适应这个新世界的CEO和创始人。你看到了什么?比如那些最AI原生的、不是在造芯片、做基础设施或大模型,而纯粹是利用这项技术来构建其他东西的创始人,如果让你观察其差异,他们给你带来的最大不同是什么?
Gavin Baker:好的,我认为这不仅仅适用于芯片设计。对我来说,这在风险投资(venture)中一直是一个根本性的问题。有些想法对地球上的每一个人来说都是显而易见的,只要他们一听到。如果你在风险投资中处于这样的位置,如果它不是很难做的事情,如果在你建立起规模(scale)之前它就已经对世界显而易见了,那么规模才是终极的优势,你就会陷入麻烦。
规模是终极优势,否则你就会陷入麻烦。而亚马逊所拥有的伟大之处在于——我认为这对于很多人来说是显而易见的,但对于零售业的CEO们来说当年并不显而易见。亚马逊非常聪明。任何风投投资的电子商务初创公司,亚马逊都会摧毁它们。他们会说:“哦,那太可爱了。我们要把我们的利润率直接降到负10000%。”就像Wayfair的那些家伙,他们做了一些极其艰苦的运营工作,亚马逊试图整死他们,但失败了。那些是真正具有强悍执行力的、非常有能力的CEO。对于我来说,在风险投资中,我总是会看:这个想法在公司建立规模之前对世界来说是显而易见的吗?还是说它既不显而易见、与众不同,又非常难做?
Gavin Baker:我认为很多创始人在AI领域正为此苦苦挣扎。我认为人们正在变得焦虑。今天,在Jensen(黄仁勋)的AI五层蛋糕中,利润正大量流向能源、流向数据中心、流向芯片、流向大模型,而并没有真正积聚到应用层。Cursor和Cognition取得了一定的规模,你知道,他们在18个月前就死死专注于编程(Coding)领域。而当时其他所有人都在关注宽泛的应用,OpenAI在做天底下所有的事情。那些专注于编程的人是Cursor、Cognition和Anthropic。事实证明,专注于代码是完全正确的。
Gavin Baker:Replit的创始人Amjad发了一条推文,我认为非常聪明。大意是说,“惨痛教训”的邻近Fact(事实)是,编程可能是通往ASI(人工通用智能)和实用AI的最短路径。因为如果你非常擅长编程,你就可以给自己写代码来做任何事情。
所以我认为那些公司极度专注于编程是非常聪明的,而且我认为它们可能都达到了一定的规模,拥有了自己的立足之地。我认为Cognition正在做一些非常非常不同的事情,但很多创始人确实在苦苦挣扎,老兄,他们真的在苦苦挣扎。他们正试图获得信心,认为在更垂直的利基(niche)领域,他们可以在大模型公司进入该利基领域之前,去获得像数据护城河(data moat)一样的东西;或者这是一个足够小的利基领域,大模型公司自己不屑于去做,但它仍然可以产生风险投资的回报。
Patrick O'Shaughnessy:这是否与你所说的“Token路径(token path)”有关?我知道你以前和我用过这个词。
Gavin Baker:是的,这个词来自Altimeter(高度计资本)的Jamin Ball。他曾说,如果你是一家软件公司或任何类型的AI公司,你必须处于Token路径上。所以DataBricks处于Token路径上,同类公司也处于Token路径上。
如果你不在Token路径上,而且你又没有处于某些非常垂直的利基领域,生活可能会变得很艰难。甚至对于这些垂直利基领域,我认为如果你去和大模型公司的人交谈,他们甚至对其中的一些也持怀疑态度。因为在这些利基领域中生成的所有数据最初都来自于人类。但接着你是在赌你能利用这个狭窄垂直领域的专有数据,去训练一个成本比前沿实验室能够达到的成本还要低的模型。也许这是一个不错的赌注,但我认为你必须非常非常小心。
Gavin Baker:另一方面,如果这些前沿Token相对于其他普通Token的溢价回报率下降,那么在应用层将会出现价值创造的大爆发。
我认为另一个非常重要的点是,我有一种信念,那就是每当Jensen想要的时候,他大概都可以用他自己的模型非常接近前沿。利用他自己的模型——他们正在做一些非常酷的事情,比如Nemotron系列(注:录音文本听误为Neimatronics,实际指英伟达自主研发的Nemotron大模型)。“使你的互补品商品化(commoditize your compliment)”。我并不认为他真的想直接颠覆客户,但这正是OpenAI和Anthropic正试图对他做、但没有成功的事情。所以,他是一个极具逻辑性的思考者,这是他必然的逻辑反制招数。
Gavin Baker:我认为海外开源模型正在以一种在资源极度受限的方式,做着非常令人印象深刻的事情。但是这其中存在着大量的知识蒸馏(distillation)。
Gavin Baker:这就是为什么我认为,除了没有足够的算力来提供服务之外,他们只是不想让自己的前沿成果被别人轻易蒸馏。他们想使用这些前沿成果,用它来对自己下一个模型进行强化学习(RL)等等。前沿上的任何实验室,一旦在经济效益上感觉良好,接下来就会陷入一些非常有趣的博弈论。
Gavin Baker:因为这是一种新型的“囚徒困境”。过去我们谈论的旧的囚徒困境仅仅是围绕着资本开支——嘿,你处于一个你不得不疯狂花钱跟进的囚徒困境中。而新的囚徒困境将是:如果你处于前沿,你是否要通过API释放那个最强模型?如果前沿上的每一个人都达成默契不同意这样做,那么外部开源很快就会断供;但只要有一个人背叛,他们就会瞬间卷走最多的用户,获得大量的收入和现金流。然后当然,资源等于智能,所以他们会开始拉开距离,接着那就会倒逼其他所有人也释放模型。所以这是一个全新的博弈论。
这类似于你与台积电、三星和英特尔之间的那种博弈。现实情况是,如果像英伟达或AMD这样的公司真的去全力支持其他代工厂中的某一个,那个代工厂就会非常快地变强。所以我确实认为Jensen会让开源保持在前沿之后的一定时间范围内。我认为这将是一件非常值得观察的有趣事情。顺便说一句,开源也是可以变现的。有一种误解认为开源是免费的。开源Token它们同样需要消耗能量,你需要用GPU来运行它们,而且开源模型公司几乎总能从云厂商那里获得收入分成。
Patrick O'Shaughnessy:你如何为前沿模型新代际(注:录音文本指下一代超强推理模型系列)的世界做交易准备?
Gavin Baker:我们只是试图在网络安全(cyber security)上过度投资。你知道,我在多个论坛上都说过一件事,并且我深信不疑:每个人都需要有一个家庭安全口令(safe word)。每个人都需要把你们的数字设备留在身后,字面意义上走到大海边,商定一个家庭安全口令或者公司安全口令。它不能是一个可以通过社会工程学(socially engineered)轻易破解的词。这完全是为了防御接下来的AI网络犯罪。比如有些看起来像你儿子、你女儿、你祖父母、你父母或其他任何人给你打FaceTime视频电话,那是对他们完全精确的模拟,它们知道你的一切细节,并且可以基于他们说过的话来外推他们可能会说什么,然后说:“出大事了,快帮我电汇100万美元。”这是最核心的防御。
Patrick O'Shaughnessy:那在主动分析层面,你还能做哪些AI无法做到的事情?
Gavin Baker:这是一个好问题。我最近刚重温了电影《最后的武士》(The Last Samurai),我让我公司的人也去看了。如果你还没看过《最后的武士》,我高度推荐。这其实是一部历久弥新的电影,是20年前汤姆·克鲁斯的电影。核心设定是,汤姆·克鲁斯是一个痛苦、过气的美国内战退伍老兵,但他其实是一个极度优秀的军人。他在明治维新期间被日本聘请,现代派元素雇佣他去训练一支由普通农民组成的军队,教他们如何手持现代火器对抗传统的武士阶层。
Gavin Baker:第一场战役,武士当然赢了,尽管武士没有枪。汤姆·克鲁斯战斗得非常英勇,所以武士决定不杀他,把他带回了村庄。他最终融入并成为了一个武士。在最后决战时,他们这群精通刀法的传统武士,被手持机关枪(machine gun)的农民军队成片地成片屠杀。机关枪就在这里,如果我们不都成为掌控机关枪的大师,我们就会被它掌控。
Gavin Baker:所以我正在努力让我自己和我们团队成为掌控这挺机关枪的大师。我很乐观。有很长一段时间,就像如果你是一个经历了许多场战争的50岁武士老兵——我打过很多场金融市场的仗,主导过很多深度研究——你在学会使用机关枪时将会有巨大的复合优势。作为一个终身的投资研究者,我很乐观我将能够掌握这挺现代机关枪(AI新技术),将它整合到我自己的工作流和公司的流程中,以那些让作为人类的我能够在很长一段时间内贡献独特价值的方式。现在,我一直有大量的Agent在后台全天候运行。
Patrick O'Shaughnessy:你目前最实用的Agent是什么?
Gavin Baker:最实用的Agent老实说——我不想伤害你的播客媒体业务——但我单一最实用的Agent是,对全网播客中那些我可能会感兴趣的硬核要点进行非常精准的提炼汇总。每天有长达六个小时的各种内容发布,我觉得看这些内容是我的工作职责。每当有来自OpenAI、xAI、谷歌、Cursor、Fireworks的人发声时,更不用说像Jensen、埃隆、Dario了。我感到不得不去看,但我只是没有那么多时间。这真的很像大海捞针。
而有一组事情我总是喜欢去看,比如我对管理层的薪酬激励结构(management compensation)非常敏感。他们被激励去干什么?他们是仅仅拥有普通的、随时间解禁的RSU(受限股票单位),还是拥有PSU(业绩股票单位)?如果他们拥有PSU,那些PSU具体在激励他们达成什么指标?
我认为能够在这方面做非常好的第一轮自动化筛选的系统,帮我们节省了巨量的时间。它把研究员解放出来去进行更有创造力的工作,而不是去翻看几百页的委托书(proxy)、拉出PSU的数据、看它与过去几年相比发生了什么变化。因为那里面有极强的公司基本面信号,而以前那是极其劳动密集的。这对于AI来说太合适了。
显然在投资领域内存在各种类似的事情。这是成为投资者最令人兴奋、最惊心动魄的时代,但是……我也有点开始担心市场出现多样性崩溃的事情了。是的,我开始......
Patrick O'Shaughnessy:再多说一点点,比如那些正在……
Gavin Baker:我不知道有任何一个像我这样的人现在对DRAM(注:原文听误为DRM,实为DRAM)不是极度看好的。没有人。没有一个人。现在的AI发生了很多非常有趣的事情。
所以,第一点是,从横截面(cross-sectionally)来看,这些估值根本说不通。它们字面意义上完全说不通。它们不可能全都是真的。你看到半导体前道设备公司(semicap equipment companies)的交易价格达到了下一季度年化利润的40倍,而DRAM(动态随机存取内存)公司的交易价格在上一轮周期峰值时却处于中个位数(5-6倍)的倍数。在过去某个周期中,这个对比是5倍对12倍。在某一个节点上,它甚至是3倍对45倍。这两者不可能同时为真。
是的,半导体资本开支的商业模式比内存的商业模式改善得更多。我们现在还不知道HBM(高带宽内存)能在多大程度上改善内存公司的商业模式。是的,由于零部件和运营维护,它们拥有某种程度的经常性收入(recurring revenue),但这绝对不值一千个百分点的估值倍数差距(1,000% multiple gap)。
我认为很难去调和像英伟达(Nvidia)这样的估值,在四月初,英伟达相对于市场的价格基本上处于过去10年或12年来的最低水平, absolute(绝对估值)也非常便宜。很难去调和它的估值与诸如GE Vernova(通用电气博新,注:大型电力能源巨头)这种公司的估值,因为后者的估值中内含了英伟达将面临无法想象的庞大市场份额流失。因此,横截面来看,估值表现得真的非常离奇。
Gavin Baker:因为我们正处于严重的短缺(shortages)之中,质量最低的公司反而表现得最好。所以如果你是一个石油和天然气投资者,或者一个大宗商品、自然资源投资者,你对思考“成本曲线”非常有经验,那么这对你来说是极其直观的。在真正的商品牛市中,成本最高的商品供应商(the commodity suppliers with the highest costs)股价上涨得最多,因为这对他们最有利。他们直接从破产的边缘变成了现金疯狂涌入(gushing cash)。
我认为这就是大宗商品投资非常非常难的一个原因。因为虽然高质量资产在整个周期中表现更好,但你只有在经济下行期(downturns)才能获得所有的超额表现。而那些在短缺期和大宗商品牛市中一飞冲天的高成本家伙,在下行期往往会直接破产。你正看到这种情况在当前AI的每一个子行业发生。
在这些不同的行业中,那些被云巨头(hyperscalers)和买方所深恶痛绝的最低质量的玩家,因为他们成本高、不可靠、零部件故障率高等等,如今他们却产能售罄并正在疯狂提价。然后,这种活动吸引了X(推特)和Reddit上那些散户账号的注意,这些股票被直接炒到了天际。而与此同时,一些更高质量的资产体现形式反而表现得相当落后。
作为投资者,这很难。因为你毫无疑问地知道(within a shadow of a doubt),那个在3个月或6个月内暴涨了10倍的低质量资产,一定会直接跌回去,这取决于他们用融到的这些现金去干什么。不过,这些低质量的公司如今确实会利用现金干一些聪明的事情。所以这让我有点担心,那些一年前极度怀疑的人现在全都不再怀疑了。
Gavin Baker:但是,当我把这与那些没有被透支的高质量公司的估值进行对比时,这又让我感觉好了一些。但现在确实感觉有点像——我一直觉得在24年和25年有人问起AI泡沫或讨论它非常搞笑,因为就像你眼前明明正放着这个核能泡沫(nuclear bubble)和量子泡沫(quantum bubble),我们在谈论什么呢?这个(AI)是如此真实。
某些核能和量子的荒谬狂热,可能已经蔓延到了更多投机性强、低质量、小市值的名字里,在这些领域如果你在X或Reddit上拥有巨大的号召力,就很容易撬动它们。这让我有点害怕,但我只是希望市场上能有更多的AI空头(bears)。比如我希望有更多的内存空头。
你知道,阿斯特拉(Astera Labs)是一只我关注了很长时间的股票。那上面有很多空头,我爱死这一点了。太棒了。你知道我最早投资了它的C轮。祝你好运,如果你认为你能在价格上比我更具信息差。祝你好运,如果你认为它是一个“铜缆输家(copper loser)”。
Gavin Baker:然后你还可以感受到市场中的各种资产板块(baskets)以及杠杆板块,你身处什么板块中是非常重要的。你知道,铜缆、光学、DRAM、NAND。而今年发生的一件非常有趣的事情是,在24年和25年,AI交易是完全绑定在一起运行的(traded together)。比如你可以做多GPU算力、交换机纵向扩展网络以及光学,并做空电力。从风险管理(risk management)的角度来看,那笔交易是行得通的,因为我非常关注因子(factor aware)。
这一切在今年一月份彻底爆掉了。这就像是,交换机纵向扩展(scale-up)网络疯狂暴涨的同时,横向扩展(scale-out)网络却在下跌,或者DRAM严重跑输NAND和HDD(机械硬盘),这在以前从未发生过。因此,AI内部的这些横截面相关性(cross-sectional correlations)彻底瓦解了。你必须变得极其精细,你再也无法用某些半导体前道设备或NAND来简单地对冲你的内存仓位。横截面上的一切在今年一月份真的发生了改变,以一种非常有趣的方式。
我认为,其中的一个原因可能是,AI已经达到了这样一种质量:突然之间让一大群人非常容易地在这些不同的子行业上变得极度精通、开始交易它们,然后它们被打包塞进各种板块(baskets)里,而那些板块——是的,创造了价格效率。是的,完全正确。
然后就像是,如果你——我认为在这些长期能带来复合回报的高质量名字之外(它们很安全,不像那些可怕的低质量名字),一些最大的机会存在于那些被“错误分类”(miscategorized)的名字里。比如Astera曾被塞进了大量的“铜缆输家”板块里。而Astera他们最大的产品将会是交换机(switch)。你同时需要使用铜缆和光学来将交换机连接到加速器。所以,从定义上讲,如果你是一家交换机公司或加速器公司,你不可能是一个铜缆输家,因为你会坐在那个连接线的另一端。
Patrick O'Shaughnessy:我想知道你是否可以简要地用一两句话分别点评一下几家主要的巨头公司。我觉得我总是忘记问你关于谷歌(Google)、微软(Microsoft)、亚马逊(Amazon)的事情。你知道的,这些处于公开市场且所有对话都围绕着它们展开的、令人兴奋的传统大玩家。
Gavin Baker:好的。首先是谷歌。去年它是不可思议的,因为他们拥有那项TPU的优势,但那个优势现在已经没有了。我认为他们仍然处于极佳位置的原因,纯粹是因为他们拥有所有人中最庞大的算力储备。我们谈到过由于短缺导致装机量基础(installed base)的价值更高。他们拥有最大的算力装机量。
是的,我对他们的无能为力(inability)感到有一点惊讶。而谷歌I/O大会就在本周召开。比如,如果他们没有发布任何即使只是稍微领先OpenAI和/或Claude一点点的成果,那将是非常耐人寻味的,而这对谷歌来说并不是灾难。只是非常有趣,这只意味着我们讨论过的“英伟达效应(Nvidia effect)”比我预想的还要更加强大。但我非常好奇想看看,在谷歌发布新东西的字面意义5天后,帕累托前沿会变成什么样子。这对他们来说是一张大牌。
但谷歌,你知道的,介于他们所拥有的数据量——其中YouTube的数据实际上具有真正极其珍贵的价值,在机器人的世界里它确实是无价之宝;以及他们拥有的算力规模,还有他们拥有的搜索业务,谷歌永远不会处于一个不好的位置。接着,你看到谷歌云(GCP)正在疯狂增长。
你必须给予扎克伯格(Zuckerberg)巨大的赞赏。他在将Meta内部彻底改造为一家AI优先(AI-first)的公司方面所做的事情。而且我确实认为他是那些真正的互联网巨头中,唯一一个真正做到这一点的创始人。我给他非常高的赞誉。我因为他在当时愿意花大价钱,你知道的,签下那些数个十亿美元的人才以及基础设施(注:原文此处为talent and Muse,实指人才与基础设施投资)合同,我认为这是一个非常大的超预期利好。Muse(注:Meta的多模态/视觉生成成果)是来自Meta的第一批大成果,虽然它没有与xAI、谷歌的最新成果以及OpenAI和Claude一起并排站在帕累托前沿的最顶端,但它非常接近。这让我印象极其深刻。所以,我认为Meta处于一个更好的位置。虽然在绝对竞争力上依然没有谷歌那么强,但
它非常接近。这给我留下了极其深刻的印象。因此,我认为Meta处于一个更好的位置。虽然在绝对竞争力上仍然没有谷歌那么强,但他们处于更好的位置。而且如你所知,在市场中,变化的速率(rate of change)往往比绝对水平(level)更重要,特别是在像三年这样的短期时间框架内。在漫长的长期时间框架内,竞争优势的绝对水平往往会占据主导地位,但即便在那个范围内,你知道,变化,变化才是真正至关重要的。
亚马逊,我认为由于Trainium,他们处于非常强劲的位置。在接下来的18个月里,你会看到由于机器人技术在其零售业务中带来的真正的P&L(损益表)效率。我实际上认为Nova,也就是他们的内部模型,虽然没有达到Meta Muse的水平,但它们比它们获得的赞誉要好。
微软,我认为Satya(萨提亚)是一个真正绝顶聪明的人,但你知道,在投资者的对话中,人们现在不再像以前那样谈论他了。我喜欢Satya,我钦佩他,我认为他是一位卓越的CEO,我非常认可他所做出的决策。但你知道,在大约三年的时间里,他从“我们要让谷歌跳舞”变成了“Copilot的产品经理”。
在针对OpenAI的那场政变企图期间,我真的很想知道萨提亚内心深处是否后悔过他的决定?萨提亚是否希望他当时支持的是Ilya(伊利亚)而不是Sam(奥特曼)?如果是Ilya和Mira(米拉)如今在真正执掌OpenAI,我真的很想知道(结果),因为我认为微软与OpenAI的合作伙伴关系在那个世界里可能会看起来非常不同。我认为这是一个我们永远不会知道答案的非常有趣的问题。
但我给他很多赞誉,就像他现在正在做的事情,他在承担风险以便他们能够赚取——你知道的,这涉及你在那层“不确定性的锥形区(cone of uncertainty)”中必须做出的决策,不仅在于你花多少钱,还在于你把钱花在什么上面。我认为微软在2025年初曾动摇过(flinched)那么一下。你知道,他们有这样一种算法:我们花这么多资本开支,我们得到这个回报。那种算法当时有点失效了。如果你动摇了,你就会失去位置,你会失去所有这些(算力芯片)配额,而且很难再拿回来。
所以他们动摇了,而萨提亚现在做出的决定——市场为此惩罚了他,但我认为这是正确的决定——就是:我们将使用我们自己的算力。我是说,如果他们愿意直接把GPU卖给OpenAI,谁知道Azure能增长得有多快?
但他们选择在内部使用算力来让自己的产品变得更好。你知道,Copilot如此糟糕或者一直以来这么糟糕的一个原因,纯粹是可用的算力不够。他们正在修正这一点。他是Copilot的产品经理,我确实认为他是一位伟大的CEO,而且他们正试图利用他们的算力来训练自己的模型。我对他们是否有合适的团队在那上面取得成功持有一点怀疑态度,但就像Meta一样,他们负担得起去雇佣一个不同的团队。
但我认为他正在做出明智且具有风险的决定,目的是在未来前沿模型不再通过API可访问的世界里为微软奠定位置。我认为这是一个非常勇敢的决定,我给他很高的赞誉。他正在放弃短期利益——如果微软当时把他们的GPU纯粹用来服务于OpenAI和Anthropic的产能,而不是将它们用于自己的产品,微软今天的股价大概会是800美元。所以我给他很高的赞誉,因为他做出了一个长线伟大的决定。
Gavin Baker:真正引人入胜的是这些公司在决策中的“外向型”程度。深度参与创业公司生态的两家公司是英伟达和亚马逊,把别人甩开了一大截。然后是谷歌,紧随其后有着非常密集的参与。
博通是以一种不同的方式参与,他们只是每个人最喜欢的ASIC(定制专用集成电路)供应商。如果你是一家初创公司,如果你在第二代芯片上能与博通合作,那被认为是一次“升级”;而如果博通在第一代芯片上就愿意与你合作,那简直被视作“天赐甘霖(mana from heaven)”。然后你看到AMD、微软和Meta对初创公司的工程生态参与基本上可以说是零。
当我说是零的时候,稍微有点绝对。但我只是对这个决定感到好奇,因为一些最优秀的团队已经不再那些大型上市公开公司里了,他们在这些规模更小的初创公司里。我认为对于英伟达以及紧随其后的谷歌来说,拥有这种你在其他云巨头(hyperscalers)身上看不到的生态参与度,最终将会成为一个巨大的优势。
Patrick O'Shaughnessy:在我们收尾之际,我很想听你聊聊对于这个巨大趋势你开始思考的任何其他看似有些不可思议的连带连锁反应(knock-on effects)。我们已经非常详细地讨论了受此影响最深的特定公司。我们稍微谈到了应用层,以及必须发生什么才能让更多的价值积聚到技术栈的这一层。我很好奇,随着这个世界如此迅速地变化,你一直在思考的任何其他好玩的连带效应是什么。
Gavin Baker:是的。这很疯狂。我是说在应用层,忘掉价值积聚吧,实际上价值已经被摧毁了(value has been destroyed)。AI已经净摧毁了——即使你把Cursor、Cognition这些最成功的AI原生企业算进去,AI在应用层也已经摧毁了数万亿美元的价值。
正是在这个背景下,我认为我们需要清醒认识到一个事实:今天那些表现最好、看到自身价值增长最多、正在创造经济价值的公司,是那些拥有“最高人均有效利用GPU比例(highest effective ratio of utilized GPUs per human)”的公司。也许这仅仅意味着每个人都将获得大量的GPU,但我认为这是一个我们有点需要意识到的有趣事实。
我只想说,虚构或者现实,这可能有一点沉重和黑暗,我越来越担心人身安全(personal safety)。我为那些拥有大得多的公开知名度、以及与AI深度绑定的人更加感到担心。但我真的很担心人身安全。我希望不会发生任何悲剧,但在美国这里政治暴力正在激增,随着AI越来越多地被政治化,我担心这会被导向越来越多的AI政治领袖。你知道,无论我们能达成什么共识,无论我怎么看待或不怎么看待OpenAI,我认为有人往山姆·奥特曼(Sam Altman)的房子扔莫洛托夫鸡尾酒是极其糟糕的。我担心由于AI,我们正走向一个拥有更高方差(higher variance)、更高贝塔(higher beta)、更高风险的世界。这对于作为个体的我是如此,对于那些棋盘上的大玩家们也是如此。
Gavin Baker:思考一下这在地缘政治上意味着什么。
如果美国因为其在AI领域的优势——如果你是美国这很棒,但对于世界其余部分来说,这是极具去稳定化(destabilizing)效应的。
所以也许它不是去稳定化的。也许它会导向另一轮由我们的AI主导地位所赋能的新“大国和平”。而我是如此乐观地认为AI将会对世界极其美妙。
Gavin Baker:有这样一个故事,某个人他的女儿被诊断出一种非常罕见的基因突变,无药可医。他能够调集大量的资源,能够从大模型实验室获取大量的算力。我们被告知了正在发生的事情,运行了极其大量的Agent,利用AI成功在现有市场上筛查并合成出了一种切实能够影响他女儿疾病的药物,然后成立了一家公司去治愈它。
由于AI,她的生命已经发生了无法估量的改变。所以我是一个AI乐观最大化主义者(AI optimist maximalist),但我也承认这就像是一个事件视界(event horizon)。它肯定将会成为一个社会需要去航行通过的“不连续点(discontinuity)”。我认为卢德分子(Luddites,技术反对者)将会是错误的,但我们需要在回应他们的关切时显得极具深度和思考。我们需要确保它对每个人都有好处。比如现在最好的AI只对拥有大量资金的人可用,这确实有一点反乌托邦(dystopian)。我们需要解决这个问题。我们需要带着谦逊去接近这一切,认识到存在大量的确定性,并且保持深思熟略。
Patrick O'Shaughnessy:当我与你录制节目时,我事后告诉人们,我说:“愿你能找到一件你热爱的事情,就像Gavin热爱市场、公司、资本主义和历史一样。”今天一如既往地完美展现。Gavin,非常感谢你的时间。
Gavin Baker:谢谢你。谢谢,Patrick。




