加文 · 贝克最新对话,细谈前沿模型、晶圆及巨头格局:如果只能盯一个指标来判断 AI 泡沫,我会盯台积电产能决策

非凡百科 网络资讯 1

精彩观点:

1、我觉得 Anthropic 烧掉的钱,可能比 OpenAI 少 80%。

2、AI 现在正从“无限量套餐”转向“按杯付费”,可能就是为什么今年我们会看到 OpenAI 和 Anthropic 的 ARR 远远超过 2000 亿美元。不只是更多算力会上线,它们还可以通过这些企业级按量方案,提高前沿 token 的价格。

3、我认为,电力短缺可能会从 2027 年、2028 年开始缓解。然后,轨道算力会真正解决这个问题。

4、事实上,按照历史上所有基础性新技术的市场先例,像 AI 这样的技术,通常都会经历泡沫。

5、现在这一轮建设有一个很大的好处,就是它仍然主要由经营现金流来融资。这和 2000 年相比,是非常重要的区别。

6、我一直比较乐观,认为今天这种根本性的晶圆短缺,也就是目前实际上由台积电控制的短缺,可能会阻止泡沫出现。

7、如果只能盯一个指标来判断会不会出现泡沫,我会盯台积电的产能决策。

8、技术快速变化带来的结果,不是让那些老 GPU 立刻报废,反而是因为 prefill 和 inference 被拆开了,它们可以被重新分工使用。

9、如果某一天真的出现一种算法突破,让模型在不需要更多算力、不需要更多数据的情况下,也能大幅提升能力,那整个 AI 基础设施投资逻辑都会受到冲击。这是真正的风险。

10、在风险投资时,我总会问一个问题:在这家公司真正建立规模之前,这件事会不会已经变得人人都懂?或者反过来,它是不是既不显而易见,又足够不同,而且真的很难做?

11、除了那些我觉得可以长期复利、而且比较安全的高质量公司之外,一些最大的机会就在那些被错误分类的公司里。

12、我认为亚马逊处在非常强的位置,因为它有 Trainium。未来 18 个月,你会在亚马逊零售业务里,看到机器人带来的真实损益改善。

听加文 · 贝克(Gavin Baker)最近这场对话,有一种扑面而来的 AI 加速感。

“我从来没有见过这样的指数增长。"

他指的是 Anthropic—— 一个月新增 110 亿美元年化经常性收入,相当于 Palantir、Snowflake 和 Databricks 这三家最受关注的 SaaS 公司各自花十年才达成的合计规模。加文用“美国商业史上最非凡的时刻”形容此刻。

加文 1999 年从 Dartmouth 毕业,本科是经济学和历史双主修(这一点和他对铁路泡沫、运河泡沫、互联网泡沫如数家珍的历史感是有关系的)。

同年加入富达,一待 18 年。期间先后覆盖半导体、医药、零售、消费、电信、媒体几乎所有重要行业,做过多只 Select 基金的经理,2009 年接掌旗舰科技基金富达 OTC(FOCPX)8 年。这只规模峰值约 170 亿美元的基金,任内年化复合回报约 19.3%,跑赢 99% 的 Morningstar 同业。

2013 年起,他在富达内部牵头一级市场投资,早早进入 SpaceX、Twilio、Cloudflare、Roku、Redfin 等公司。

这段经历让他在 2019 年 1 月自立门户创立 Atreides Management 时,把一二级市场打通做跨界基金。

他本人也是 Cerebras、Astera Labs 这些 AI 芯片公司的早期投资人,对英伟达的投资关注持续 20 多年。

对话人是投资播客 Invest Like the Best 的主理人帕特里克 · 奥肖内西(Patrick O'Shaughnessy),两人非常熟稔。

这一次围绕的核心是电力与晶圆,AI 建设的两大天花板。加文细致拆解了产业各方将如何分别应对:地面涡轮机扩产、SpaceX 用激光连接的“轨道算力”、台积电对扩产节奏的微妙拿捏、Terafab 这样的新晶圆厂入场打破单一供给。

他说,如果只能盯一个指标来判断 AI 会不会出现泡沫,我会盯台积电的产能决策。

围绕这条主线,对话延伸到许多细节:Anthropic 为何刻意让 Claude“收着点用”、亚马逊的 Trainium 在 ASIC 竞争中的位置、模型公司面对的新“囚徒困境”、应用层为何被毁掉数万亿美元价值、被“错误分类”的公司里藏着哪些机会、agentic world 中 CPU 为何重新变得重要、谷歌 / Meta / 亚马逊 / 微软四家巨头眼下各自处在什么位置。

And 加文还借电影《最后的武士》打的比方:技术革命来临时,旧时代最优秀的武士也会被一个端着机关枪的农民屠杀。他说,“我正在努力成为机关枪大师。"

加文是极度乐观的 AI 支持者。他相信 AI 会改写生物医药、延长人类生命。

访谈尾部那个父亲为患罕见基因突变的女儿启动 agent 寻药的故事,让人印象深刻。但他也有担忧:AI 正让世界进入“波动更大、尾部事件更多”的状态;最好的 AI 目前只服务于有钱人,多少有反乌托邦色彩;地缘政治正被悄然重塑;还有 AI 伪造下的安全问题,

又是一篇大部头的对话实录,聪明投资者(ID: Capital-nature)原汁原味地放出来,并在部分地方做了备注,方便大家丝滑地理解。Enjoy it~

一、今年三四月投科技,只要看 Anthropic 正在发生什么就够了

帕特里克 你经历今年 3 月和 4 月那段时间时,是什么感觉?对我来说,那像是一个很独特的经济、技术和市场环境。你又一直是一个非常认真研究历史,也非常认真观察当下的人。所以,那段时间对你来说到底是什么感觉?

加文 大体上说,回撤有两种。

一种是你真的错了。比如一家公司业绩不及预期,你原来的投资假设被证伪了。这时候你就得认错,接受损失,把这个亏损真正确认下来。

但还有另一种回撤,或者说另一种跑输。你之所以跑输,是因为一些你非常了解的公司在下跌,而你对市场给出的价格走势非常不同意。这个时候,你反而可以加仓。

在这种情况下,你不是在确认亏损,而是在积累一种被压制的 alpha,也就是未来还没有释放出来的超额收益。

对我来说,今年 3 月就是这种感觉。

当时纳斯达克在下跌。但与此同时,我认为 AI 领域正在发生的事情,是美国商业史上最非凡的时刻。

我指的是,Anthropic 新增了 110 亿美元 ARR,也就是年度经常性收入。

真正让我震惊的是,SaaS 和云计算革命大概创造了 5 万亿到 10 万亿美元的价值。过去 10 年、12 年里,如果要说最受关注的三家 SaaS 公司,大概就是 Palantir、Snowflake 和 Databricks。

这三家公司雇了几千人,合起来可能上万人。它们都花了 10 年时间,才把自己的业务做到今天这个规模。

而 Anthropic 在一个月里,就新增了相当于这三家公司合计规模的业务。

这太疯狂了!

我们这些科技投资人,经常会听到大家谈 S 曲线,谈怎么投资指数级增长。但我从来没有见过这样的指数增长。

这甚至比 DeepSeek 那次还要极端。DeepSeek 当时也是一个很类似的局面。

如果回到 2025 年,DeepSeek 引发了一场巨大抛售。

但那件事本身非常奇怪,因为 DeepSeek 那篇论文,其实在 DeepSeek Monday 之前 7 天就已经发表了。我记得应该是发表在美国一个假期的周一。

我读完之后想:“嗯,这东西感觉可能很重要。”

帕特里克 可能很重要。

加文 但它未必会被市场解读成对 AI 交易有利。所以我当时采取了行动。

一周之后,就到了 DeepSeek Monday,AI 相关股票真的崩了。

但这件事很奇怪,因为到了 DeepSeek Monday,当时其实已经非常清楚,DeepSeek 会是有史以来对算力需求最利好的事情之一。

AWS 亚洲可用区的价格已经差不多翻倍了。你能看到 GPU 可用性在下降。

这也是我们第一次真正看到,推理模型在推理阶段,比非推理模型消耗的算力要多得多。

所以那次也是一个类似的局面,只不过你需要做一些功课才能看出来。

但其实也没有那么难。你只要看到,股票在下跌,DRAM 价格在直线上涨,亚洲 GPU 价格在直线上涨,GPU 可用性在下降。

然后两三天之后,美国的 GPU 租赁价格也开始上涨。

但今年 3 月就更简单了。你什么都不用做,只要看 Anthropic 正在发生什么就够了。

现在很多人好像都很后悔。后悔 2022 年没买,后悔 COVID 期间没买,后悔 DeepSeek 那次没买。

但 4 月初,其实又出现了一次类似的估值机会,而且这一次 AI 的拐点更加清楚。

所以,过去其实已经有很多次可以买入 AI 的机会。

当然,让这件事变复杂的,是所谓的“海峡公式”。

我后来开始相信这一点,现在也仍然相信市场可能误判了一件事。

我不是宏观专家。但我确实做很多和国家安全相关的投资,所以能接触到一些真正懂这方面的人。他们也很愿意和我分享自己的判断。

我认为,霍尔木兹海峡如果关闭,对美国来说,实际上相对是非常有利的。

帕特里克 为什么?

加文 因为这其实非常符合当前美国政府的目标。

电力是工业和制造业里非常重要的投入。对美国电价来说,最关键的变量之一,也是影响 AI 成本的重要变量,就是天然气价格。

当时,美国天然气价格下跌了 20%。

但亚洲、欧洲以及其他地区的天然气价格,翻了一倍,甚至两倍。

所以,美国的相对制造业竞争力,几乎在一夜之间就提升了。

不管你喜不喜欢,这似乎就是特朗普政府最关心的事情。他们非常在意美国相对于其他国家的位置。

很多人对 1970 年代还有记忆。70 年代之所以那么痛苦,不只是因为价格上涨,而是因为当时真的出现了汽油短缺。

但今天的情况已经很不一样了。美国经济对能源的依赖程度,比当年低得多。美国现在是全球最大的石油和天然气生产国,也已经是全球最大的石油和天然气出口国。

在这个基础上,如果美国又获得了相对制造业的优势,那情况就完全不同了。

所以对我来说,这让我更容易继续把注意力放在 AI 的基本面上,也继续关注当时从历史上看非常有吸引力的估值。

我认为,从相对估值看,当时科技股相对于市场其他部分,几乎已经便宜到过去 10 年里最便宜的水平之一。

你可以从市场有效性的角度想想这件事。

我们正在经历资本主义史上最非凡的时刻,而这对 AI 极度利好。可就在这个时候,你居然还有机会用非常有吸引力的估值买入 AI。

二、Anthropic 在最新估值基础上,有能力再溢价至少一倍融资

帕特里克 你怎么看 Anthropic 和 OpenAI 的估值倍数?

在我看来,它们是这个趋势里最纯粹的参考资产。但它们的估值其实并没有那么夸张。

如果只看销售倍数,把它们和 Databricks、Snowflake 这些公司在估值高点时的水平相比,你怎么理解?

加文 我确实认为,从资本效率角度看,OpenAI 和 Anthropic 是两种很不一样的公司。

Anthropic 每生成一个 token 的成本,明显低于 OpenAI。它就是更低。

你只要看它们为了做到差不多的收入规模,各自烧掉了多少钱,就能看出来。

我觉得 Anthropic 烧掉的钱,可能比 OpenAI 少 80%。

帕特里克 没错。

加文 所以作为一门生意,它们的结构性 ROIC,也就是投入资本回报率,显然很不一样。

当然,OpenAI 也在做很多事情。我认为莎拉 · 弗里尔(Sarah Friar)是一位非常出色的 CFO。他们正在努力改善这个问题。

帕特里克 而且他们确实锁定了很多算力,比别人更多。

加文 对,他们锁定了很多算力。这也是一个很大的差异。

事实证明,激进一点是有回报的。

但如果 Anthropic 估值 9000 亿美元,对应 500 亿美元 ARR……

帕特里克 而且还在以 1000% 的速度增长。

加文 对,增长速度荒唐的高!

也许更真实的说法是,如果 Anthropic 拥有全部所需算力,它今天的收入很可能已经远远超过 1000 亿美元,可能达到 1500 亿美元。

而且我确实认为,Anthropic 现在有意让 Claude “收着点用”。

有一项分析显示,即使是 Claude Opus,对于完全相同的问题,它生成的 token 数也减少了 70%。

我们上次也谈过,在某种程度上,token 数量就等于回答质量,也等于思考质量。

当然,每个 token 里的智能密度也很重要。

作为用户,我自己也确实感觉到了这一点。

所以我认为,如果不受算力限制,Anthropic 的收入会高得多。可能是 1000 亿、1500 亿,甚至也许是 2000 亿美元。

帕特里克 所以你可能是在用 5 倍“无约束收入”买它。我们可以创造一个新指标,URR,也就是 unconstrained run-rate revenue,无约束运行收入。

加文 对。

帕特里克那为什么它们不按 3 万亿美元估值融资 1000 亿美元之类的?如果你是 Anthropic 的 CFO 的话。

加文 我认为它们现在这样做是明智的,因为未来是不确定的。

你显然处在一场资本极其密集的游戏里。即使是 Anthropic,我相信它们今天在推理业务上的毛利率已经非常不错。

Anthropic 今年就会开始产生现金流,我觉得它们很可能已经开始了。

但即便如此,你仍然希望未来还能继续融资,继续拿到更多算力。因为这个世界是不确定的。

如果你看埃隆 · 马斯克,他一直为投资者赚钱。他把这件事看成一种神圣契约。

正因为过去 20 年里,他一直让投资者赚到钱,所以他拥有了一种超级能力。那就是,他基本上可以在任何时候、按照自己想要的规模融资。

我认为,这些公司现在这样做是明智的。

我不知道他们是不是这样思考,但我确实认为,专注于让投资者赚钱是一件明智的事。

这种好处不只是持续一两年,而是可能持续未来 20 年到 30 年。

帕特里克 埃隆做到这一点的方式,是不是系统性地低估 SpaceX 或其他公司的估值?具体来说,他是怎么做到的?

加文就是从不在估值上贪心,从不把估值推到极限。

帕特里克 就这么简单?

加文 对,就这么简单。

我的朋友安东尼奥(Antonio)曾经指出,过去十多年里,SpaceX 的年化复合回报大概是 30% 出头。

我认为原因就在这里。埃隆一直很重视保留这种融资能力,也一直努力在投资者和员工之间取得一个公平的平衡。

所以我觉得,这是非常明智的。

但如果你问,Anthropic 能不能在传闻中的最新估值基础上,再溢价至少一倍融资?当然可以。

三、电力短缺可能会从 2027 年、2028 年开始缓解

帕特里克 我们来聊聊 watts and wafers,也就是电力和晶圆。这一直是我最喜欢和你聊的话题。

我感觉,每次我觉得 AI 基础设施建设已经有点过热了,下一次再和你聊,又会觉得我们之前其实建得还不够。

你研究过很多 S 曲线,也研究过这些 S 曲线到底能有多陡,而且你很懂历史。你来讲讲,你现在怎么看电力和晶圆,它们作为整个 AI 体系最关键投入的重要性。

加文 我会说,资本主义大概率会解决电力短缺问题。前提是没有非常大的监管或政治反弹。当然,我认为这种反弹确实有可能发生。

有一家大型私募股权公司里负责数据中心基础设施投资的人,我记得可能是黑石、阿波罗(Apollo)或者 KKR 的人,说过一句话:“过去,能源和芯片是我们最大的瓶颈。现在,分区规划和审批变得更重要了。”

我认为很多公司都在等中期选举之后再采取行动,比如裁员之类的动作。没有公司想在中期选举期间被政客和舆论拿来当靶子打。

但你已经看到,很多制造涡轮机的公司开始宣布大规模扩产计划。

当然,这里面确实有很多问题。比如,能铸造这些大型叶片的机器,全球可能只有两台。西方已经 80 年没有造过这种机器了,很多能力已经丢掉了等等。

这些都是真的。

我也绝不是在低估这里面的工业工程难度。那里面确实有很多技术、工艺,甚至可以说有某种工程艺术。

但随着时间推移,资本主义非常擅长解决这类问题。

而且除了这些涡轮机之外,从更长周期看,还有其他能源来源。

所以我认为,电力短缺可能会从 2027 年、2028 年开始缓解。然后,轨道算力会真正解决这个问题。

我也想重新定义一下“轨道算力”。因为当人们听到“太空数据中心”,脑子里往往会想象一个漂浮在太空中、像五角大楼那么大的建筑。

然后他们会说:“这不可能做到。”

但它不是那个样子。一个 Blackwell 机架重 3000 磅,高 8 英尺,深 4 英尺,宽 3 英尺。

所谓轨道算力,本质上就是把机架放到太空里。

SpaceX 已经给过示意图了。那就是一个机架,那颗卫星本身就是一个机架。

它的大小大概和 Blackwell 机架差不多。它两侧会展开太阳能翼,每边可能有 500 英尺长。

你把它放在太阳同步轨道上,这样太阳能板就能一直照到太阳。

而且因为它处在严格的太阳同步轨道上,散热器可以从它背后延伸出去几百英尺。

帕特里克 嗯。这也是大家常见的质疑之一。

加文 对,散热器在阴影里。

帕特里克 你到底怎么给它散热?

加文 这些年我在 Starbase 待过很多时间,也和很多 SpaceX 工程师聊过。

我确实认为他们是地球上最有才华的一群工程师。而且在这件事上,他们非常有信心,认为散热问题已经解决了。

他们并不是对所有事情都这么有信心。

比如,要把星舰(Starship)变成火星殖民运输器,我觉得可能还有不少工程问题要解决。

他们最终会做到吗?我相信会。

但如果问他们现在更关注什么,我觉得可能是维修和维护。

这也是两个最大的质疑点。一个是散热器,另一个是机架里出了问题怎么修。

答案是,在你拥有某种漂浮版 Optimus 之前,大概没法修。

但我确实认为,星舰会以我们现在无法想象的方式改变太空经济。

尤其是如果监管变成地面数据中心的限制因素,那很多地面约束就不重要了。你能造多少轨道算力,就能卖多少。

然后很自然地,你会用穿越真空的激光,把这些太空机架连接起来。而这项技术现在已经在每一颗星链(Starlink)卫星上了。

让我觉得震撼的是,SpaceX 运营着全球最大的卫星星座,占在轨卫星的 98% 或 99%。每一颗星链卫星,今天都在运行,也都在被冷却。

我认为星链 V3 的功率会达到 20 千瓦。而一个 Blackwell 机架,也不过 100 千瓦。(也就是说,太空算力要达到一个 AI 机架的功率水平,并不是差了几个数量级,而是大概 5 倍的差距。对 SpaceX 来说,这当然很难,但不是完全不可想象。)

人们经常谈密度。但如果你是在真空中用激光连接机架,就可以把机架做得更大一些。物理上,你真正关注的是重量,而不是体积。

在地球上的数据中心里,你要连接机架,理想情况下会尽量用铜缆,并尽可能缩短距离。布线本身就是很大一项成本。

所以你当然希望机架尽量小,能用铜就用铜,必须用光的时候才用光。

但在太空里,SpaceX 可以做很多事情。我觉得一些怀疑者没有认真想过这些可能性。

关键是,它们运营的卫星数量超过任何人。它们今天已经有 20 千瓦的卫星。所以一开始也许只是把它扩到 60 千瓦。

但他们似乎非常有信心,可以直接做到 100 千瓦、120 千瓦。

而且,同一家公司现在也运营着地球上最大的数据中心。它们有世界上最好的硬件工程师。

与此同时,很多外界的怀疑者,其实既没有 SpaceX 工程师那么聪明,也没有他们那么懂实际工程。

拉里 · 埃里森(Larry Ellison)在之前有人质疑这件事时,说过一句很简单的话:“听着,他正在外面回收火箭。我没看到别人能回收火箭。”

现实是,10 年过去了,仍然没有其他公司能够持续、稳定地回收并完全复用一枚轨道火箭。

而如果没有可复用性,这一切都不成立。可复用性意味着你必须把火箭降落回来。

所以我更愿意把轨道算力定义为“太空中的机架”,而不是漂浮在太空里的五角大楼式巨型数据中心。

帕特里克 对,后者听起来确实有点荒唐。

加文 但真正可以做到的是,用激光把这些机架连接起来。数据中心的本质,就是这些机架之间的连接。

所以它会是一组太空中的机架,通过激光连接成一个虚拟数据中心。

四、如果只能盯一个指标来判断 AI 泡沫,我会盯台积电的产能决策

帕特里克 如果我们想象一下那个世界,假设这些事情真的发生了,而且我们已经非常擅长以经济方式把这些东西送上去,在太空中到处跑矩阵乘法,那这对地面数据中心意味着什么?

加文 有人曾经说过,美国会尽可能用力地吸取它能得到的每一种能源。我认为算力也是一样。

这也是为什么我现在对“边缘 AI”这个空头逻辑没有以前那么担心。

我们会消耗掉尽可能多的算力。

推理非常适合轨道算力,但训练在很长一段时间里,仍然会在地球上完成。

所以我不认为这对地面数据中心特别利空。我认为在我的有生之年,地面数据中心仍然会非常有价值。

但如果你身处电力生产和冷却这个生态里,而且正在大规模扩产,那你确实要认真想一想。

因为很多产能投放的时候,可能正好赶上那些原本很轻视轨道算力的人,开始意识到这件事是真的。

如果你是这些公司之一,这件事值得非常认真地思考。

当然,在过渡阶段,也会发生很多很酷的事情。

比如,我们现在越来越擅长改造喷气发动机。Boom Aerospace 就在做这件事。

所以,电力这一侧有很多事情正在发生。资本主义正在非常努力地解决电力问题。

但晶圆这边,情况就不一样了。

晶圆掌握在台湾一群非常坚韧、年长的人手里。他们是台湾最重要的一群人。

台积电占台湾 GDP、用水、用电的比例都非常高。大家经常说“硅盾”。他们自己也把自己看作张忠谋神圣遗产的继承者。

我清楚记得,20 多年前我去新竹科学园区拜访时,曾经问他们:“你们觉得自己有一天能追上英特尔吗?”

他们回答说:“这是一个很美的梦,但那应该是我们孙辈的梦。”

后来他们真的做到了。

当然,一部分原因是英特尔自己犯了错误,但他们确实做到了。

只是,他们的思维方式很不一样。

黄仁勋之所以经常飞去台湾,一个原因就是他希望台积电扩产。

让我觉得很有意思的是,黄仁勋和台积电之间从来没有合同。他们做生意,似乎靠的是公平感和握手。

帕特里克 嗯。没有合同,真有意思。

加文 他们相信,长期来看这会是公平的。我们是合作伙伴,我们会彼此公平对待。

事实上,按照历史上所有基础性新技术的市场先例,像 AI 这样的技术,通常都会经历泡沫。

卡洛塔 · 佩雷斯(Carlota Perez)写过一本很好的书,讲的就是这个过程。

基本上,市场是有效的。它会正确意识到,这是一项基础性的新技术。

然后就会出现迈克尔 · 莫布森(Michael Mauboussin)所说的“多样性崩塌”:所有人都开始看好同一件事。

我现在确实开始有点担心这种多样性崩塌。

接下来,你就会得到一个泡沫。

这个泡沫会为新技术的基础设施建设提供资金。但当供给跑到需求前面之后,就会出现崩盘。如果这种建设还是靠债务驱动的,就像 2000 年那样,崩盘会特别严重。

现在这一轮建设有一个很大的好处,就是它仍然主要由经营现金流来融资。这和 2000 年相比,是非常重要的区别。

估值也是一个区别。

还有一个区别是,今天每一块 GPU 都在 100% 利用率下运行;而当年互联网泡沫时期,99% 的光纤都没有被使用。

所以这里确实有很多根本差异。

但我们仍然要清醒。历史不会简单重复,但会押韵。作为投资人,我们必须意识到这一点。

如果看过去两三百年的历史,别只看互联网泡沫,还有铁路泡沫、运河泡沫。我们应该预期泡沫会出现。

这很可怕。没有人想要泡沫。泡沫很糟糕。

它之所以糟糕,是因为如果你对估值敏感,你会在泡沫阶段大幅跑输,然后很可能被所有客户解雇。

已经离世的乔治 · 范德海登(George Vanderheiden),曾经是富达非常优秀的基金经理。

1999 年,他选择对抗泡沫。到 2000 年初,他退休了。我觉得是因为他实在承受不了了。

他一头白发,是一个真正伟大的人。我和他只有很短暂的交集,但他是我好朋友、也是我导师詹妮弗 · 乌里格(Jennifer Uhrig)非常重要的导师和朋友。

通过她,我身上也有很多范德海登的影响。

他说过一句名言:“早得太多,和错没有区别。”

乔治后来退休,就是因为他受不了持续跑输,也受不了客户不断问他:“你到底怎么了?你怎么就是不懂?”

而当时,他的基金里大概 40% 是烟草股,40% 是住宅建筑商。

结果接下来三年,他相对于纳斯达克的表现,可能跑赢了 20 倍到 30 倍。

我一直比较乐观,认为今天这种根本性的晶圆短缺,也就是目前实际上由台积电控制的短缺,可能会阻止泡沫出现。

如果台积电按照黄仁勋希望的方式扩产,我认为英伟达在 2026 年或 2027 年可以卖出 2 万亿美元的 GPU。也许是 2.5 万亿美元,甚至 3 万亿美元。

但消费者能消化的算力总有一个边界。到某个程度之后,你大概就会进入过度建设。

所以,如果我们最后没有出现泡沫,真的应该为台积电开一个庆祝派对。因为它将凭一己之力阻止一个泡沫。

帕特里克 现在你已经开始看到一些公司转向英特尔和三星。假设台积电面对这些迟来的需求,仍然处在极度供给受限的状态,那会发生什么?

加文 市场历史告诉我们,英特尔和三星之间,我不知道会是哪一家,但它们不可能一直保持克制。

总会有一家先忍不住。

一旦有一家开始放量、开始抢市场,在某种程度上,其他人也会被迫跟上。

所以我认为,关键很大程度上取决于台积电能在多长时间里,继续保持对英特尔和三星的领先。

你要记住,这种领先可能是 9 个月、12 个月、15 个月,或者……

帕特里克 类似先进制程节点上的领先。

加文 完全正确。

所以它们扩产的节奏非常重要。

如果只能盯一个指标来判断会不会出现泡沫,我会盯台积电的产能决策。

我认为这里存在一个“刚刚好”的区间。也就是说,台积电扩产要足够多,让英特尔或三星很难真正大规模成为第二供应商,很难拿到远高于 30% 的市场份额。

但与此同时,台积电又要保留晶圆这个根本性约束,让供给不要一下子放得太开,从而帮助整个行业避免泡沫。

当然,我认为 Terafab 也会参与到这个过程中。

Terafab 是 SpaceX 参与其中的一个合资项目(我相信特斯拉也有份),目标是在美国建设全球最大的晶圆厂。

我认为他们会成功。

第一,他们和英特尔有合作关系,这非常重要。因为这意味着他们可以获得英特尔 50 年积累下来的制度性知识。

虽然这套能力已经不是最前沿,大概落后 9 个月、几个季度,或者说 12 个月、三到五个季度,但它仍然是一种优势。

另一个优势是,我相信 Terafab 会得到所有半导体设备公司 A 级团队的支持。

当年台积电之所以能追上来,一个重要原因就是阿斯麦(ASML)、KLA、泛林集团(Lam Research)、应用材料(Applied Materials)这些公司,都希望它追上来。

这些设备公司不喜欢只有一个买方的局面,所以当时它们最强的团队都去了台湾地区。再加上英特尔自己犯了一些错误,机会就出现了。

这一次,因为埃隆在硬件工程上的声誉,这些 A 级团队会来到美国。

还有一点,在美国可能有些人很难想象。现在政治在某种程度上已经取代了宗教。因为埃隆曾经卷入政治,所以美国一些人很难客观看待他。这其实很可惜。

因为我确实认为,他为美国做的事情,可能比任何其他美国人都多。

他几乎凭一己之力把制造业带回美国。他复兴了国防科技。SpaceX 在某些方面已经是美国最重要的国防承包商。

星链对世界的意义也非常了不起。他创造了大量蓝领制造业岗位,而这本来也是很多自由派希望看到的事情,对美国也有好处。

他可能比任何在世的人都更大程度地推动了全球脱碳。

如果你因为环保原因反对把数据中心建在地球上……

帕特里克 这正是太空数据中心的好处之一。

加文 对,那这不就是答案吗?

所以我觉得很可惜。在美国,因为政治让很多人一叶障目。

我观察他很久了。我觉得他会做的事情,就是把最优秀的人才招过来。

因为最好的工程师都想为埃隆工作,尤其是在硬件工程领域。

他会招来非常厉害的工程师。

然后,在 Terafab 旁边,可能会有一个小镇。你最喜欢台湾哪些餐厅?好,那我就把这些餐厅和整个团队都从台湾搬到得克萨斯,把一切都做成他们喜欢的样子。

帕特里克 精确调校。

加文 对,精确调校。目的就是为了招到最好的工程师。

而这不是英特尔和三星管理者通常会有的思维方式。

所以他会拥有最优秀的人才,会得到晶圆厂设备公司 A 级团队的支持。

他还有英特尔这个合作方,这也很重要。

这件事也非常符合任何一届美国政府的政治目标。而且我认为,它和现有格局足够不同,不至于疏远台积电。

当然,这些事情都有很长的前置周期。也就是说,Terafab 真正开始生产英伟达 GPU,或者其他芯片,会是相当久以后的事情。

五、打破“苦涩教训”仍然是真正的风险

帕特里克 埃隆做事情往往和别人不一样。别人建一个数据中心要花 3 年,他 122 天就建起来了。你知道,三星甚至不得不在得州晶圆厂里给他安排一间办公室,因为他对它们扩产和建设的速度非常不满意。

我们可以继续观察。

你刚才提到了 DeepSeek。市场对 DeepSeek 最简单的反应是:好,未来这些模型会以极低成本做到前沿模型 95% 的效果。

如果往前快进两年,我这样一家小公司,可能就没必要每年花 100 万美元买 token 了。但现在真实情况看起来并不是这样。我很好奇,在你看来,为什么会出现这种落差?

加文我觉得最有意思的,是前沿模型到底能赚多少钱。

AI 在模型这一层创造了很多经济价值。但让我意外的是,到目前为止,这些价值绝大部分还是流向了最强的前沿模型,而不是那些更便宜的开源模型。

所以,对投资人来说,最关键的问题就是:这种情况会不会持续?未来企业和用户是否还会继续为最强模型支付高价?

我还记得 Gemini 3.1 Pro 刚出来时,我觉得非常震撼。它太好了。

但今天再用,已经让人很难忍受了。

这里面可能有一个动态:很多公司会先用最强的前沿模型做原型,验证产品能不能跑通;但真正投入生产时,它们可能会转向成本更低的方案,比如 Vertex,或者一些开源模型。(也就是说,最强模型可能负责“探索和打样”,便宜模型负责“大规模落地”。)

但即便如此,今天的事实仍然是,绝大多数经济回报还是来自前沿 token。(这里的“前沿 token”,可以简单理解为用户调用最强模型时消耗的 token,也就是最贵、最强那部分模型服务。)

这点很出人意料。

这种情况会不会继续下去,我觉得是一个非常有意思的问题。经历过 Gemini 3.1,再经历 Opus 之后,我对这个问题变得开放了很多。

我也在用 Grok 4.3。它在帕累托前沿上。

(所谓帕累托前沿,简单说,就是在“模型有多聪明”和“使用成本有多低”之间,做到最优组合的那条边界。)

现在处在帕累托前沿上的公司是……

顺便说一句,这是一个很大的变化,也是我们上次聊过那件事的结果:谷歌因为在 TPU v8 上做了非常保守的设计选择,试图部分摆脱博通,结果失去了 token 成本的领先地位;而英伟达还在继续做更激进的选择。

以前是谷歌主导帕累托前沿。我认为,这是分析 AI 实验室时最重要的指标。

9 个月前,谷歌主导这条前沿。在帕累托前沿的每一个点上,OpenAI、xAI 和 Anthropic 都在谷歌里面。(意思是,它们要么同样成本下没有谷歌聪明,要么同样智能水平下成本比谷歌高。)

但现在,帕累托前沿主要由 Anthropic 和 OpenAI 主导。Grok 4.3 也在这条前沿上。它显然是最好的低成本 5000 亿参数模型。

Gemini 3.1 则像是勉强挂在帕累托前沿上。如果让我猜,我会说谷歌现在是出于自尊在补贴它。

我还想说一点:如果理查德 · 萨顿(Richard Sutton)的“苦涩教训”被打破,那一定是这笔 AI 交易,也是整个 AI 叙事最大的风险。

所谓“苦涩教训”,简单说就是:从长期看,更多算力和更多数据,通常会胜过人类设计出来的精巧算法。(也就是说,不是人类想出一个特别聪明的小技巧就能赢,而是规模更大、算力更多、数据更多的系统往往会赢。)

不过,越接近 AI 的人,越怀疑这件事会被打破。

我认为 3 月市场走弱的一个原因,是 TurboQuant,谷歌的一种内存优化技术。一年前已经有论文写过。

当时谷歌正和美光、三星、SK 海力士谈长期协议,也就是可能锁定很长时间高价格的 LTA。就在谈判过程中,谷歌把 TurboQuant 放了出来。

人们做什么,永远比他们说什么更重要。

谷歌只是把它在 X 上宣传了一下。然后它就病毒式传播了。大家开始说:“天哪,DRAM 完了。这里有一个 DRAM 优化技术。”

但我找不到地球上任何一个 AI 工程师相信 TurboQuant 会对 DRAM 需求产生实质影响。

不过,即便如此,违反“苦涩教训”仍然是真正的风险。

也就是说,如果某一天真的出现一种算法突破,让模型在不需要更多算力、不需要更多数据的情况下,也能大幅提升能力,那整个 AI 基础设施投资逻辑都会受到冲击。

(因为今天大量投资都建立在一个前提上:更强的 AI 需要更多算力、更多芯片、更多内存、更多数据中心。)

这是真正的风险。

我认为,真正构建这些模型的人,对这个风险比较怀疑。(也就是说,他们不太相信单靠某个算法技巧,就能绕开大规模算力这条路。)

我之所以没有那么怀疑,是因为我觉得我们已经非常接近 ASI(人工超级智能)。谁知道“苦涩教训”对一个 400 智商的模型还是否成立?

也许我们会经历一个短暂阶段。比如你真的走到 ASI,它首先想要的,可能就是让自己更聪明,也拥有更多资源。

它会怎么做?它会让自己变得更高效。

所以我认为,这确实是一个风险。

人类本身也包括在“苦涩教训”里。(换句话说,过去是“更多算力胜过人类小聪明”;但如果 AI 本身变得远比人类聪明,它也许能设计出人类想不到的优化方法,短暂打破这条规律。)

我们很快就会知道,这条教训是否适用于 300 智商的 AI,然后是 400、500、600 智商的 AI。

到某个阶段,我们也许会因为 AI 或 ASI,看到对“苦涩教训”的短暂违背。

六、AI 现在正从“无限量套餐”转向“按杯付费”

帕特里克 我很好奇,你怎么看模型周围的一些新创新?比如持续学习和记忆,这两个方向现在很多人都在关注。大家似乎觉得,它们可能会带来下一个新范式。你怎么看它们的作用?

加文  我认为,在记忆这件事上,我们已经通过这些 harness 做了很多。

事实证明,harness engineering 没有模型本身那么重要,但它真的很重要。而且现在,harness 和模型越来越多是在一起开发的。

你可以简单把 harness 理解成模型运行时所在的环境。它知道工具在哪里,会帮模型建立上下文、记忆和状态,也会包含一些非常具体的提示词和指令。

帕特里克 它会带来很大差别。即使是很简单的版本,也会有差别。

加文  差别惊人。

我说过作为投资人,你至少要每月花 250 美元,去买最高档的 AI 版本。只有这样,你才能对 AI 的真实能力形成自己的直觉。

但现在,这已经不够了。

如果你想理解今天前沿 AI 真正能做什么,即使不是写代码的用途,你也需要用 ClaudeCode 或 Codex,而且需要企业版方案。

原因是,AI 模型已经开始转向按使用量计费。我认为,这也是谷歌失去成本领先之后带来的一个变化。

如果你用的是每月 250 美元、300 美元或者 280 美元那种套餐,你会受到非常严格的速率限制。你拿到的是一个被限制了能力的 AI 版本。

我们刚才也说过,Claude 现在生成的 token 少了 70%。

如果你希望 Claude 和它的 harness 按照它们真正认为必要的方式去思考、去输出,从而给你一个好答案,那你就必须用按量计费方案。

顺便说一句,这对 AI 行业非常利好。

我在 2005 年到 2007 年做过电信分析师。蜂窝通信在此前 10 年一直是一个很好的增长行业,原因就在于,它同时有固定套餐和超额使用后的按量收费。

比如,你每月有 900 分钟通话时间,超过以后,就按使用量付费。

蜂窝通信什么时候不再是一个很好的增长行业?就是所有人都转向无限量套餐的时候。

长途电话也是一样。

AI 现在正从“无限量套餐”转向“按杯付费”。事实证明,人们真的很喜欢和远方的朋友聊天,真的很喜欢用手机,也真的很喜欢用 AI。

尤其是现在,一个人可以同时让 100 个 agent 工作。

所以我认为,转向按使用量计费,可能就是为什么今年我们会看到 OpenAI 和 Anthropic 的 ARR 远远超过 2000 亿美元。

因为不只是更多算力会上线,它们还可以通过这些企业级按量方案,提高前沿 token 的价格。

但这也有点令人难过。

对整个世界来说,这有点令人难过。因为这意味着,如果你付不起这个钱,你就接触不到最前沿的 AI。

至于持续学习,天哪,如果我们真的解决了这个问题……

帕特里克 你怎么理解持续学习?

加文  人类大脑有太多谜团。和 AI 相比,人类是非常简单、非常高效的学习者。

我记不清具体数字了,但 AI 需要的样本量……

帕特里克 差了好几个数量级。

加文  对,差了很多个数量级。

今天,在某些事情可以被验证的情况下,我们已经有一种很粗糙的持续学习版本。比如,在训练阶段做强化学习。

但真正的持续学习,是模型能够动态调整自己的权重,或者以某种方式实时更新自己。

帕特里克 就像人类那样。

加文  对。比如我第一次把手伸进火里,就会学到一件事:以后绝不能再把手伸进火里。

但今天的模型可能需要把手伸进火里 100 万次,然后模型设计者还要在下一轮训练里,或者在一个强化学习环境里,把“火”这个场景放进去。它才会真正学会。

所以我认为,它必须能够动态更新权重。但我也相信,除了这个方向之外,人们还在研究很多非常聪明的方法。

如果我们真的实现持续学习,那就会出现非常快速的起飞。现在很多人似乎很有信心,认为持续学习已经不远了。

我认为,这是第三个重大问题。

第一,ASI 会不会导致“苦涩教训”被打破?也就是说,真正打破它的不是人类的小聪明,而是超级智能本身。

第二,前沿 token 是否还能维持今天这样的溢价?

第三,我们会不会实现持续学习?如果会,什么时候实现?

七、新的芯片公司要成功,要满足三点

帕特里克 新的芯片公司在这一切中扮演什么角色?

我们聊了很多英伟达,以及它和台积电、英特尔这些公司的关系。现在有一千朵花在开放,可能真的有上千家公司在尝试做新的芯片,想解决这个瓶颈里的某一部分。

我很好奇,你怎么理解这个领域、这个机会,以及它们会扮演什么角色?

加文  我认为这对世界来说是好事,也是健康的。对黄仁勋来说也是好事。因为如果换一届政府,可能会有不同看法。

竞争对所有人都有好处。

在坦克设计里,人们会讲“铁三角”。更通俗地说,就是一个“不可能三角”:攻击力、防御力和机动性不可能同时拉满。

原因很简单,防御越强,也就是装甲越厚,坦克就越重,机动性就越差。所以你必须在这个三角里做取舍。

比如以色列的梅卡瓦坦克,就是更偏向防御。俄罗斯坦克和豹式坦克,一般更偏向机动性。

芯片设计也是一样。

你必须活在一些由物理定律决定的根本约束里,而这些约束已经写进了台积电的设计规则。

TPU、Trainium(亚马逊为机器学习训练和推理设计的自研加速器)和 AMD,本质上都在试图成为一个更好的 GPU。

今天来看,我认为 Trainium 可能做得最好。

当然,没有谁真的已经做出了一个更好的 GPU。但 Trainium,我觉得它已经开始在“扯超人的披风”了。

而且这还没有真正开始。Trainium3 还需要进入量产爬坡,因为它有 switch scale-up network,也就是交换式的 scale-up 网络。要想经济地推理 MoE 模型,这种网络非常重要。

很多公司的架构还是 torus 架构,谷歌以前就是那样。

AMD 方面,我们还要看。MI450 现在还不清楚。相比 MI450,我们可能对 Trainium3 知道得更多。

但这是一场很难玩的游戏。所以你必须做一些不一样的事情,而且这件不一样的事情本身也必须很难。

我的经验法则是,1% 的市场份额就值 1000 亿美元。而 1000 亿美元已经是一个非常好的风投结果。

这种状况下,黄仁勋会说:“好,如果有人做了一个不同的东西,并且拿到 1%、2% 或者 3% 的份额,那我们就会去做那种芯片。”

这件事会发生在所有人身上。

但如果你只是想做一个更好的 GPU,那祝你好运。如果你要做不同的东西,它也必须很难做。

你可以做不同的取舍。

prefill 和 decode 的解耦,确实打开了更大的设计空间,让芯片设计师可以做不同的选择。

prefill 可以简单理解为模型读入上下文、理解问题;decode 则是模型生成答案、写出输出。

我有一位很棒的同事,叫安德鲁 · 福克斯(Andrew Fox)。他说,你可以想象一艘 18 世纪的英国海军战舰。prefill 是给大炮装弹,decode 是开火。

prefill 本质上就是模型理解问题、理解 prompt,并且持续跟踪自己正在生成的答案。

它受内存容量限制。

decode 是生成新 token 的过程,它主要受内存带宽限制。

所以,如果你是芯片设计师,这会给你一块更大的画布,让你可以作画。

但即便如此,你做的事情也必须很难。

因为如果你只是围绕那个“不可能三角”做一些不同取舍,比如优化内存容量,但这些取舍并不难,那英伟达也会做同样的取舍。

而且,它们从台积电拿到的价格,会比你能拿到的价格好得多。

英伟达还有另一个优势:它们和每一家模型公司都在合作,可以不断用真实需求来优化自己的设计。

顺便说一句,还有一件很有意思的事。

如果你是一个风投,正在投资一家半导体公司,而这家公司告诉你,它们会因为某种台积电工艺获得优势,因为它们对这个工艺有特殊访问权。

我可以向你保证,当这个工艺还只是台积电脑子里的一个念头时,黄仁勋就已经看过了。

而且英伟达对这个工艺的了解,远远超过这家只有 200 个人的小公司所能想象的程度。

台积电以及供应链里的每一个人,都会把所有东西拿给黄仁勋看。就像它们会把所有东西拿给亚马逊、AMD、TPU 团队看一样。

这也是为什么我说,不要试图做一个更好的 GPU。你可以做一些不同的东西,你可以在 prefill 这块画布上作画,也可以在 decode 这块画布上作画。

但你做的东西必须很难。因为一旦它做大了,你马上就会遇到那几家巨头,它们会成为非常快的跟随者。

我们公司曾经是 Cerebras 的风险投资人。

Cerebras 做的是一件很难、而且从根本上不同的事,也就是晶圆级计算。它当然有一系列取舍,但他们当初做出的架构选择非常难,也让他们能做一些别人做不了的事。

我们会看到这件事最终能做多大。

他们现在也在做一些非常酷的事情。Cerebras 面临的一个问题是,一旦你需要把很多芯片连接在一起,搭建 scale-up 或 scale-out 网络,你就需要大量 IO。而 IO 会受到所谓 shoreline 的限制,也就是芯片边缘长度的限制。

所以,Cerebras 的片上计算和内存,相对于芯片边缘 IO 来说,比例非常高。

但他们是非常聪明的人。他们做了一件非常难的事。现在他们在探索,能不能把一片光学晶圆直接放在上面。如果能做到,就可以解决这个问题。

我相信他们也在研究 DRAM 的混合键合,去绕开一些所谓的限制,而那些限制并不一定是真限制。

理论上,Cerebras 的机器可以运行任何规模的模型。只是对于某些模型规模,它的表现会比其他规模更好。

所以我觉得 Cerebras 有意思的地方就在于,它做了一件不同的事,而且这件事真的很难。晶圆级计算非常难。

我确实认为,这些新芯片公司有自己的位置。我也会鼓励所有人:做不同的取舍,而且做一件困难的事。

Cerebras IPO 之后,大家都会融到钱。融资不会是问题。但 Cerebras 花了三代芯片,才把这件事做对。

帕特里克 对,现在已经是一家 10 年历史的公司了。

加文 这真的很难。

你看安德鲁 · 费尔德曼(Andrew Feldman),也就是 Cerebras 的 CEO,就能看出来他和整个团队走到今天有多不容易。

这些公司需要有那种韧性和抗压能力。

第一颗芯片失败了,这很正常。问题是,你能不能回来做第二颗芯片?

关于这个话题,我还想说最后一点,这会极大提升 GPU 的使用寿命,甚至可能凭一己之力拯救私人信贷。

帕特里克 多讲讲。你说私人信贷是什么意思?

加文 私人信贷现在正因为那些 SaaS 贷款承受压力。不管这些贷款现在已经减记了多少,我觉得可能还得继续减记。

原因很简单,如果连上市公司都很难适应这个新世界,那一家背着大量债务的公司,要怎么适应?它又怎么去投资一门利润率结构完全不同的新业务?

但另一方面,私人信贷也投了很多 GPU 相关资产。

他们当初给这些 GPU 融资时,我猜大概是按 3 年或 4 年的使用期限去算的。

但因为推理现在被拆开了,我认为这些 GPU 的实际使用寿命可能会变成 10 年,甚至 15 年。

AI 怀疑论者会说:“这些公司都在做账。GPU 的使用寿命只有一两年。CPU 的使用寿命也只有 4 年,因为技术变化太快。”

但我觉得不是这样。

技术快速变化带来的结果,不是让这些老 GPU 立刻报废,反而是因为 prefill 和 inference 被拆开了,它们可以被重新分工使用。

你可以把 Cerebras 系统,或者 Groq 的 LPU,放在 Hopper 甚至 Ampere 前面。英伟达实际上也通过收购获得过相关能力。

这样一来,Hopper 和 Ampere 这些老 GPU 仍然可以负责 prefill,也就是读入上下文、理解问题的那部分工作。它们的使用寿命就可以一直延长,直到硬件真的烧坏为止。

当然,它们确实会烧坏,硬件总有物理寿命。但也许你不需要让它们跑得那么满、那么快。

这对整个私人信贷行业都会非常有利,也会帮助 AI 基础设施继续融资。

因为如果你可以用更接近 5% 或 6% 的利率去给 GPU 融资,而不是像 CoreWeave 那样最低融资成本也在 7% 出头,那从数学上就会改变整个 AI 建设的融资成本。

也就是说,我们现在有一种技术创新,它既能降低融资成本,也能延长地球上算力资产的使用寿命。

还有一件事也很有意思。Altimeter Capital 的贾明 · 鲍尔(Jamin Ball)最近做了一档播客,Coatue 也出过一份报告。他们讲到,短缺的卖方表现远远好于短缺的买方。所谓短缺的买方,就是那些科技巨头。

但如果你已经拥有一个巨大的装机基础,而这个东西现在正处于短缺状态,那同样是一个非常好的位置。

我们现在也听到,在 Agentic world,也就是智能体世界里,CPU 变得比以前重要得多。

因为 CPU 要负责很多编排、工具调用,以及各种协调工作。而全球最大的 CPU 集群,就在那些科技巨头手里。

所以我认为,这些科技巨头中的一部分,可能会在某种程度上追上那些“短缺的卖方”。

帕特里克 我想把“不同而且困难”这个想法,从基础设施之外拿出来聊聊。

你现在开始和很多新创始人交流,也和那些必须适应这个新世界的现任 CEO、创始人交流。

你看到的那些最 AI 原生的创始人,不是做芯片、基础设施或模型,而是用 AI 去创造其他东西的人,他们和过去的创业者相比,最不一样的地方是什么?你有没有观察到一些差异?

加文 首先,我觉得这不只是芯片设计的问题。对我来说,这一直是风险投资里的一个根本问题。有些想法,一旦说出来,全世界都会觉得显而易见。

如果你投的是这种东西,而且它本身又不难做,那就很危险。因为在你建立规模之前,如果这个机会已经变得人人都懂,你就麻烦了。

规模才是最终的优势。

亚马逊当年的幸运之处就在于,电商这件事对很多人来说可能是显而易见的,但对传统零售业 CEO 来说并不显而易见。

而且亚马逊非常聪明。只要有风投投了一家电商公司,亚马逊就会去打它们。

亚马逊会说:“哦,这很可爱。那我们就把这个品类的利润率打到负 10000%。”

Wayfair 那些人之所以能活下来,是因为他们做了一件很难的事。亚马逊试图杀死它们,但没有成功。

那些 CEO 在运营上非常强,真的很能打。

所以在风险投资里,我总会问一个问题:在这家公司真正建立规模之前,这件事会不会已经变得人人都懂?

或者反过来,它是不是既不显而易见,又足够不同,而且真的很难做?

我认为,很多 AI 创业者现在都在这个问题上挣扎。

他们很担心,因为按照黄仁勋那套“五层 AI 蛋糕”的说法,今天的利润正在流向能源、数据中心、芯片和模型,但并没有真正流向应用层。

Cursor 和 Cognition 已经做到了一定规模。它们专注于编程。18 个月前,真正专注于编程的是 Cursor、Cognition 和 Anthropic。而专注代码这件事,事后看是非常正确的。

Replit 的创始人阿姆贾德 · 马萨德(Amjad Masad)发过一条推文,我觉得非常聪明。

大意是,有一个接近“苦涩教训”的事实:编程可能是通向 ASI 和有用 AI 的最短路径。

因为如果一个 AI 真的非常擅长编程,它就可以给自己写代码,去做几乎任何事情。

所以我认为,这几家公司高度专注于编程,是非常聪明的。而且它们大概都已经做到了一定规模,足以在这个生态里拥有自己的位置。

我觉得 Cognition 正在做一些非常非常不同的事情。

但很多创始人真的很挣扎,他们真的很挣扎。他们现在想证明一件事:在一些更垂直、更细分的领域里,他们可以先到达那里。

也就是说,在模型公司进入这个细分领域之前,先建立起数据护城河。

或者证明这个细分领域足够小,模型公司不会亲自下场做,但它又足够大,仍然能带来风投意义上的回报。

八、模型公司面对的新的“囚徒困境”

帕特里克 这和你说过的 token path 有关吗?我知道你以前跟我提过这个词。

加文 这个说法大概是来自 Altimeter 的贾明 · 鲍尔。他说,如果你是一家软件公司或者任何形式的 AI 公司,你必须处在 token path 上。

Databricks 就在 token path 上。类似的公司也在 token path 上。

所谓 token path,可以简单理解为你的产品或数据,必须参与到 AI 生成、调用、处理 token 的过程中。换句话说,你不能只是站在 AI 旁边,而是要嵌在 AI 工作流里。

如果你不在 token path 上,又不是做某个非常细分、非常特殊的东西,那日子可能会很难。

即使是在这些垂直细分领域里,如果你和模型公司的人聊,他们对其中一些机会也会比较怀疑。

因为这些细分领域里产生的数据,本质上还是人类产生的数据。

而你的赌注是你可以用这个狭窄垂直领域里的专有数据,训练出一个成本低于前沿实验室未来能做到的模型。

也许这是个不错的赌注。但我认为,你必须非常非常小心。

另一方面,如果未来前沿 token 相对于其他 token 的溢价下降,应用层就会出现一场巨大的价值创造。

我还有一个很重要的观点,我相信只要黄仁勋愿意,他大概也可以做到接近前沿模型。

帕特里克 用他自己的模型?

加文 用他自己的模型。英伟达正在做一些非常酷的东西,比如 Pneumatronics。

帕特里克 就像乔尔 · 斯波尔斯基(Joel Spolsky)会说的,“商品化你的互补品”。

加文 对,但我不认为黄仁勋想这么做。

某种程度上,OpenAI 和 Anthropic 是在试图对他做这件事。但它们并没有成功。

所以逻辑其实很简单。黄仁勋是一个非常讲逻辑的人,这就是合乎逻辑的反制动作。

你会看到,开源模型会在一段时间里,一直落后真正的前沿模型。

今天所谓的开源前沿,主要是一些中国模型。

中国开源模型在资源非常受限的情况下,确实做出了非常了不起的东西。只是其中有不少蒸馏。

这也是为什么我认为,Anthropic 它们不只是没有足够算力来服务 Mythos,也是不想让 Mythos 被别人蒸馏。

它们想自己用 Mythos,自己蒸馏它,再用它来给下一个模型做强化学习,或者做其他事情。

最终,如果 OpenAI 觉得经济上划算,任何处在前沿的公司都会面对一个非常有意思的博弈论问题。

我们之前谈过旧的囚徒困境:你必须持续投入、持续花钱,否则就会落后。

新的囚徒困境会是:如果你站在模型前沿,你到底要不要通过 API 把这个模型放出来(给外部客户调用)?

(不开放,可以保护模型,避免别人拿你的输出去蒸馏和追赶;但开放,又能带来大量收入、用户和现金流。问题在于,只要有一家前沿公司先开放,其他公司就很难不跟。)

如果其中有一家公司背叛,选择把模型通过 API 放出来,它就会拥有最好的模型,获得大量收入和现金流。

而资源就等于智能。

它会开始拉开差距。然后这会迫使其他所有前沿公司也把模型放出来。

这就是新的博弈论。有点像前面说到的台积电、三星和英特尔之间的博弈。

现实是,如果英伟达或 AMD 这样的公司,真的开始认真使用某一家其他晶圆代工厂,那家代工厂会很快变好。

所以我确实认为,黄仁勋会让开源模型在一定时间里落后于真正前沿。我觉得这会非常值得观察。

顺便说一句,开源也是要变现的。

“开源是免费的”其实是一个误解,开源 token 也要消耗能源。生成这些 token 需要能源,也需要 GPU。而开源模型公司几乎总是会拿到收入分成。

九、我正在努力成为“机关枪大师”

帕特里克 你们怎么为 Mythos-3、Mythos-4 的世界做准备?

加文 我们正在非常重视网络安全,甚至可以说是在超前投资网络安全。

有一件事我在很多场合都说过,而且我真的相信:每个家庭、每家公司,都应该提前设一个“安全词”。

所有人都应该放下电子设备,真的去海边,和家人设一个安全词,或者和公司设一个安全词。

而且这个安全词不能是那种可以被社会工程学猜出来的东西。

这是为了防范网络犯罪。

比如有一天,像你的儿子、女儿、祖父母、父母,或者任何亲人的人给你 FaceTime。它看起来完全就是那个人,是一个极其精准的模拟。

它知道所有事情,还能根据他们过去说过的话,推断出他们可能会怎么说。然后它跟你说:“给我转 100 万美元。”

帕特里克 这是防御层面。那进攻层面呢?或者说,从分析能力上看,你们还能做什么,是它做不了的?

加文 这是个好问题。

我最近刚看了《最后的武士》(The Last Samurai),也让公司里的人去看。

如果你没看过,我非常推荐。那其实是一部很经得起时间考验的电影,是汤姆 · 克鲁斯(Tom Cruise)20 年前拍的。

故事设定是,汤姆 · 克鲁斯演一个痛苦、落魄的美国内战老兵,但他其实是一个非常优秀的军人。

他之所以痛苦和落魄,是因为他觉得自己参与了美国对原住民做的一些不好的事情。

后来,日本雇用了他。故事发生在明治维新时期,日本政府里的现代派请他训练一支由农民组成的军队,让他们学会如何和武士作战。

第一次战斗发生了。结果当然是武士赢了,尽管他们没有枪。

他作战非常英勇,所以武士决定不杀他,而是把他带回自己的村庄。

后来,他成了一名武士。

这对他来说有点像美国内战,所以他最后站在武士一边作战。

但结局是,他被一个拿着机关枪的农民屠杀了。

现在,机关枪已经出现了。如果我们不能都学会掌握机关枪,就会被机关枪掌握。

所以我正在努力成为“机关枪大师”。

我也比较乐观。假设你是一个 50 岁的武士,打过很多仗,有非常丰富的战场经验。即使进入机关枪时代,你在使用机关枪时,仍然会有优势。

我乐观地认为,作为一个终身学习投资的人,我能够掌握这把“机关枪”,也就是 AI 这项新技术。

我可以把它整合进我自己的投资流程,也整合进我们公司的流程。这样,作为一个人,我应该还能在很长一段时间里继续贡献价值。

但和所有人一样,我现在也一直让各种 agent 运行着。

帕特里克 你现在最有用的 agent 是什么?

加文 对我来说,最有用的 agent 就是把播客里那些可能对我有价值的点,整理成一份非常好的摘要。

每天大概有 6 个小时的内容,我觉得从工作角度看,自己都应该去听、去看。

每次 OpenAI、xAI、谷歌、Cursor、Fireworks、Base10 的人出来讲话,更不用说黄仁勋、埃隆、达里奥这些人,我都会觉得自己必须看。

但我根本没有那么多时间。这里面有很多信息,真的是大海捞针。

还有一些东西,是我每次都特别想看的。比如,我对管理层薪酬非常敏感。他们到底被激励去做什么?他们拿的是那种很普通、甚至有点愚蠢的 RSU(待满时间就能拿股票),还是 PSU(业绩达标才拿股票)?如果是 PSU,这些 PSU 具体激励他们做什么?

我觉得,有些系统已经可以很好地做第一轮筛选。

这能节省大量时间,让人把精力放在更有创造性的工作上,而不是去一页页翻代理声明,把 PSU 那一段找出来,再对比过去几年的代理声明,看它发生了什么变化。

这里面当然有信号,但这件事非常耗人力,而这正好适合 AI。

投资里还有很多类似的事情。

所以,这是一个做投资最令人兴奋、也最让人激动的时代。

不过,我也开始有一点点担心。

十、市场的一些大机会是在那些被错误归类的公司里

帕特里克 你是说“多样性崩塌”那件事?

加文 对,我开始有点担心。

帕特里克 你能不能再多讲一点?比如是哪类人让你担心?

加文 我现在几乎找不到一个和我类似、但不看好 DRAM 的投资人。

帕特里克 一个都没有?

加文 一个都没有。

现在 AI 里发生了很多有意思的事情。

第一,从横向比较看,很多估值完全说不通。它们就是不合理,不可能同时都是真的。

比如,有些半导体设备公司,按下一季度年化利润算,交易在 40 倍市盈率;而 DRAM 公司只交易在中个位数倍数。

上一轮周期高点时,这个差距大概是 5 倍对 12 倍,有一段时间甚至是 3 倍对 45 倍。

这些估值不可能同时都是对的。

当然,半导体设备公司的商业模式,确实比存储公司的商业模式改善得更多。我们也还不知道 HBM 会在多大程度上改善存储公司的商业模式。

是的,它们有一些来自零部件和维护的经常性收入,但这不足以支撑 1000% 级别的估值倍数差异。

我也很难把英伟达的估值和 GE Vernova 这类公司的估值放在一起理解。

英伟达在 4 月初的时候,相对整个市场,基本已经便宜到过去 10 年、12 年里最便宜的水平之一。从绝对估值看,也非常便宜。

但你再看 GE Vernova 的估值,里面似乎隐含着英伟达未来会出现一个难以想象的份额损失。(英伟达卖的是 AI 算力的核心芯片,直接受益于 AI 算力需求;GE Vernova 做的是电力设备、燃气轮机、电网、电力系统相关业务,受益于 AI 数据中心带来的电力需求。)

所以,不同股票之间的估值差异非常大。

第二,因为我们处在短缺环境里,质量最低的公司反而表现最好。

如果你是油气投资人、矿业投资人,或者自然资源投资人,并且熟悉成本曲线,这件事会非常直观。

在一个真正的商品牛市里,成本最高的商品供应商往往涨得最多。因为价格上涨对它们最有利。它们会从濒临破产,突然变成现金流滚滚。

我觉得这也是为什么商品投资非常难。

从完整周期看,质量好的公司会跑赢。但在短缺和商品牛市阶段,最强的上涨往往来自那些高成本公司。到了下行周期,这些在牛市里暴涨的高成本公司,可能就会破产,或者发生类似的事情。

你现在在很多行业里都能看到这种现象。

那些让科技巨头和买方讨厌的质量最低的公司,成本高、不可靠、零部件故障率高等等,但现在它们也卖光了,而且还在涨价。

然后这类公司一旦被 X 上的散户账户盯上,股票就会被一路炒上去。反而一些质量更高的投资标的,表现明显落后。

这对投资人来说很难。因为你几乎可以很确定地知道,那些三个月或六个月涨了 10 倍的股票,最后会跌回去。当然,这也取决于它们怎么使用手里的现金。

但低质量公司很少会聪明地使用现金。

所以这让我有点担心。一年前还非常怀疑的人,现在已经不再怀疑了。

但另一方面,当我再去看那些高质量公司的估值,它们又并没有被拉得很高。这让我感觉好一些。

我一直觉得,2024 年和 2025 年,有人问 AI 有没有泡沫、谈 AI 泡沫,这件事挺好笑的。因为核能泡沫和量子泡沫明明就在你眼前。我们到底在讨论什么?

要知道,AI 这件事是真实的。

但现在,核能和量子里那些荒唐的情绪,可能已经开始蔓延到一些更投机、质量更低、市值更小的 AI 相关股票上。

如果你在 X 或 Reddit 上影响力很大,就很容易推动这些股票。这让我有点害怕。

我只是希望市场上有更多 AI 空头。我也希望有更多存储空头。

比如 Astera(一家做 AI 数据中心高速连接芯片的公司)是我长期关注的一家公司。它有很多空头,我很喜欢这一点。

我最早是在 C 轮投它。所以,如果你觉得自己能比我更准确地给它定价,那祝你好运。如果你认为它是所谓的“铜缆输家”,那我也只能祝你好运。

你还能感受到市场里各种 basket,也就是篮子交易和杠杆篮子。你被市场放进哪个篮子,非常重要。

(大家觉得某些公司都受益于铜缆,就把它们放进“铜缆篮子”;觉得某些公司都受益于光通信,就放进“光模块篮子”。一旦资金开始买卖某个篮子,里面的股票就会一起涨跌,不一定完全取决于公司本身基本面。)

比如铜缆、光模块、DRAM、NAND,这些都是不同的篮子。

今年发生了一件很有意思的事。

2024 年和 2025 年,AI 交易基本是一起走的。所以你可以做多 GPU 算力、scale-up networking 和光通信 scale-out,同时做空电力。

从风险管理角度看,这个交易是有效的,因为我非常关注因子暴露。

但今年 1 月,这套逻辑被打散了。

比如,scale-up networking 可能疯狂上涨,而 scale-out 在下跌;或者 DRAM 大幅跑输 NAND 和 HDD,这在过去并没有发生过。

所以,AI 内部这些横向相关性真的瓦解了。你必须看得非常细。

你不能再随便用半导体设备公司或 NAND 股票去对冲 DRAM 风险,因为它们现在不一定一起涨跌了。

今年 1 月,AI 内部的横截面关系发生了非常有意思的变化。

我认为其中一个原因可能是,AI 的能力已经到了一个新水平,很多投资人突然可以借助 AI,很快弄懂这些细分领域,比如铜缆、光模块、DRAM、NAND、scale-up、scale-out,然后开始交易它们。

接着,这些股票又被放进不同的交易篮子里。而这些篮子本身的买卖,反过来又会影响个股价格。

帕特里克  AI 在创造价格效率。

加文 对,完全正确。

我认为除了那些我觉得可以长期复利、而且比较安全的高质量公司之外,一些大的机会就在那些被错误分类的公司里。它们和那些低质量、令人害怕的公司不一样。

比如 Astera 被放进了很多“铜缆输家”的篮子里。

但 Astera 最大的产品会是交换机。连接交换机和加速器时,会同时用到铜缆和光通信。

所以从定义上说,如果你是一家交换机公司,或者一家加速器公司,你就不可能是铜缆输家,因为你正好在那条连接的另一端。

十一、关于谷歌、Meta、亚马逊和微软的点评

帕特里克 我想请你用一两句话点评一下几家主要公司,比如谷歌、微软、亚马逊这些上市巨头。现在很多讨论都围绕那些令人兴奋的新公司展开,但这些主要玩家也很重要。

加文 当然。

先说谷歌。去年它非常了不起,因为它有 TPU 优势。但这个优势现在已经消失了。

我认为谷歌仍然处在很好位置,原因是它拥有最多算力。我们刚才谈过,在短缺环境下,已有装机基础的价值会变得更高。

而谷歌拥有最大的算力装机基础。

但我确实有点惊讶,它现在表现出某种无力感。

Google I/O 就在本周(5 月 19 日举行)。如果谷歌这次不能发布一个至少略微超过 OpenAI 或 Claude 的模型,那会很值得关注。

这不是说谷歌就完了,当然不是。只是这会说明,我们之前谈到的“英伟达效应”可能比我想象得还要强。也就是说,英伟达的 GPU、网络、软件和整个生态,可能正在给 OpenAI、Anthropic、xAI 这些公司带来更强优势,即使谷歌有自己的 TPU,也未必能轻松领先。

所以我非常好奇,等谷歌发布新东西之后,整个模型竞争的帕累托前沿会怎么变化。也就是,谁能在“模型能力”和“使用成本”之间做到最优组合。

对谷歌来说,这次发布会是一张很重要的牌。

不过谷歌拥有的数据量非常大,尤其是 YouTube 数据,确实很有价值。在机器人时代,这些数据真的有价值。

再加上它拥有的算力,以及搜索业务,谷歌永远不会处在一个很差的位置。你也可以从 GCP 的高速增长里看到这一点。

Meta 方面,你必须给扎克伯格很大认可。

他把 Meta 内部变成一家 AI-first 公司,这件事做得非常了不起。我确实认为,在那些真正的互联网巨头里,只有他做到了这一点。

这一点我非常认可。

他当时愿意为 AI 人才付出高价,开出那些 10 亿美元级别的合同,我也非常认可。

Muse 我觉得是一个很大的上行惊喜。这是 MSL 的第一个模型。它还没有进入 xAI、谷歌那个单一模型,以及 OpenAI 和 Claude 所在的帕累托前沿,但已经相当接近。

这让我印象很深。

所以我认为 Meta 的位置比以前好了。它的绝对位置仍然没有谷歌那么强,但它正在变好。

而你也知道,在市场里,变化率比绝对水平更重要,尤其是在三年左右这样的中短期时间框架里。

在更长周期里,竞争优势的绝对水平通常会占主导。但即便如此,变化本身也非常重要。

亚马逊,我认为它处在非常强的位置,因为它有 Trainium。

未来 18 个月,你会在亚马逊零售业务里,看到机器人带来的真实损益改善。

我其实认为,Nova 这些内部模型虽然还没有达到 Muse 的水平,但比外界给它们的评价要好。

微软方面,我认为萨提亚 · 纳德拉(Satya Nadella)是一个非常聪明的人。但在投资人交流里,大家谈他的方式已经不像以前那样了。

我喜欢萨提亚,也钦佩他。我认为他是一位非常出色的 CEO。我也非常认可他过去做过的很多决策。

但你也知道,微软当初的姿态是要用 AI 和搜索挑战谷歌;三年后,萨提亚更像是在亲自承担 Copilot 的产品压力。

我很想知道,在 OpenAI 那次政变期间,萨提亚是否后悔过自己的选择?他是否希望自己当时支持的是伊利亚(Ilya Sutskever),而不是萨姆(Sam Altman)?他是否希望今天真正运营 OpenAI 的,是伊利亚和米拉(Mira Murati)?

我真的很想知道他内心深处的答案。因为如果是那个世界,微软和 OpenAI 的关系可能会非常不同。

这是一个非常有意思的问题,但我们永远不会知道答案。

不过,我还是很认可他。

他现在正在做的事情,是在冒险。这也回到一点:在不确定性很高的环境里,你必须做决策。你不仅要决定花多少钱,还要决定把钱花在哪里。

我认为,微软在 2025 年初确实犹豫了一小段时间。

它们原来有一个算法:我们花这么多资本开支,就会得到这样的回报。但那个算法失灵了。如果你犹豫,你就会失去位置。你会失去所有这些资源分配,而且之后很难拿回来。

所以它们当时犹豫了。虽然市场因此惩罚了他,但我认为现在萨提亚正在做的决定,是正确决定。

这个决定是,“我们要把算力用于内部”。

谁知道如果它们愿意直接把 GPU 卖给 OpenAI,Azure 会增长多快?但它们选择把算力用于内部,让自己的产品变得更好。

Copilot 之所以这么差,或者过去这么差,一个原因就是算力不够。它们现在正在修复这个问题。

萨提亚放弃了很多东西。我的意思是,如果微软今天把所有 GPU 都用来服务 OpenAI,以及 Anthropic 的需求,而不是用于自己的产品,微软股价大概已经是 800 美元了。

所以,我很认可他做了一个伟大的决定。

真正有意思的是,这些公司在决策上与外部世界互动的程度差异很大。

和创业公司互动最深的两家公司,远远领先的是亚马逊和英伟达。然后是谷歌,谷歌也有非常密集的互动,强度排在下一档。

博通的互动方式不一样。它基本上是所有人最喜欢的 ASIC 供应商。

如果你是一家创业公司,第二代芯片能和博通合作,会被认为是升级。如果第一代芯片就能和博通合作,那简直是天降甘霖。

然后你会看到,AMD、微软和 Meta 与创业公司的互动几乎为零。

我说“几乎为零”,当然有一点夸张。但我确实很好奇这些公司为什么会做出这样的选择。因为现在一些最好的团队,已经不在大型上市公司里了,而是在这些小型创业公司里。

我认为这最终会成为英伟达的一个很大优势。亚马逊、谷歌紧随其后。它们和创业公司之间有这种互动,而你在其他科技巨头那里基本看不到。

十二、对于 AI 的乐观以及担忧之处

帕特里克  我们已经非常详细地聊了受影响最大的具体公司,也聊了一点应用层,以及如果更多价值要流向这一层,需要发生什么。

我很好奇,在这个世界变化得这么快的过程中,你还在想哪些有意思的连锁反应?

加文  这确实很疯狂。

在应用层,先别说价值有没有流入,价值实际上已经被毁掉了。

帕特里克 没错。

加文 从净值上看,AI 已经在应用层毁掉了很多价值。

即使把 Cursor、Cognition 这些最成功的 AI 原生公司算进去,AI 在应用层毁掉的价值,也已经是数万亿美元级别。

在这个背景下,我觉得有一点值得我们注意:今天表现最好的公司,那些估值涨得最快、真正创造经济价值的公司,往往是那些“每个人对应的有效 GPU 数量”最高的公司。

也许这只是说明,未来每个人都会拥有很多 GPU 资源。但无论如何,这是一个很有意思的现象,我们需要意识到这一点。

我还想说一点,可能有点黑暗:我越来越担心个人安全。

我真的越来越担心这件事。尤其是那些公众曝光度更高、和 AI 关系更深的人,我特别担心他们的个人安全。

我希望不要发生什么悲剧。

但美国现在政治暴力正在上升。而随着 AI 越来越政治化,我担心这种暴力会越来越多地指向 AI 领域的关键人物。

不管我们怎么看 OpenAI,也不管我个人对 OpenAI 有什么看法,有人向萨姆 · 奥尔特曼的家扔燃烧瓶,这都是一件非常糟糕的事。

我担心因为 AI 我们正在进入一个波动更大、风险更高、尾部事件更多的世界。

这既关系到我个人,也关系到这盘棋上的那些重要玩家。

你再想想这在地缘政治上意味着什么。

如果美国因为 AI 优势获得压倒性地位,这对美国当然是好事。但对世界其他国家来说,它也可能带来不稳定。

我对 AI 仍然非常乐观。我相信它会给世界带来非常好的东西。

我认识的一个人,他的女儿被诊断出一种非常罕见的基因突变,而且没有现成的治愈方法。

他调动了很多资源,也从一些 AI 实验室拿到了大量算力。那些实验室知道了这件事,也愿意提供帮助。

然后,他启动了大量 agent,用 AI 在现有药物里寻找可能影响这种疾病的药物。后来,他又创办了一家公司,希望真正治愈这种病。

因为 AI,他女儿的人生已经发生了巨大变化。这种变化几乎无法衡量。

所以,我是一个 AI 乐观主义者,而且可以说是极度乐观。

但我也承认,AI 有点像一个事件视界(一旦越过这个边界,事情就不可逆了,你没法再回到原来的状态,也很难看清边界另一边到底会发生什么)。

它一定会成为一个不连续点。社会必须一起穿过它,也必须一起学会应对它。

我认为勒德主义者(那些反对新技术、害怕技术取代人类、认为技术进步会伤害普通人的人)。最终会是错的。

但我们也必须非常认真地对待他们的担忧。我们必须确保 AI 对所有人都有好处。

现在最好的 AI 只对有钱人开放,这确实有点反乌托邦。

这个问题必须解决。

我们需要带着谦卑面对这一切,承认其中有很多不确定性,然后认真、审慎地处理。