庄明浩做了181页PPT。
这是他历史上页数最多的一次演讲。2026年1月底,他用这份PPT复盘了2025年AI行业发生的一切。标题只有九个字:同一代技术,两个系统。
如果你还在把中美AI竞争理解为「谁的模型更强」,你可能忽略了真正的分水岭:同一代大模型技术下,两个国家正在展开完全不同的系统演化。
庄明浩说,2025年不再只是能力的竞赛,而是系统的展开。
「在同一代大模型技术约束之下,美国与中国几乎同时走向了相似的方向:更大的算力投入、更激进的资本趋势、更一致的技术想象。但当这些技术真正进入产业组织与市场,差异开始显现。」
这是两套系统在同一时间各自展开的过程。
先看美国。
2025年,模型发布按周计算。DeepSeek R1、GPT-4.5、Claude 4、Gemini 2.5、Gemini 3、视频模型Veo 3、Banana、可灵、海螺。每周都有头部厂商发新模型。
但庄明浩的第一个观察是:「2025年是资源投入从预训练转向后训练的元年。」
以前,大家把资源砸在预训练上——喂数据、扩参数。现在,预训练按Sam Altman的说法「可能已经挖到70-80%了」,边际效应显著变差。
所以资源转向后训练:强化学习环境搭建、任务设置、模型表现打分。这是肉眼可见中短期内模型厂商都要做的重投入。
谁在搭建这些强化学习环境?
除了模型厂商自己,美国出现了一批初创公司,专门只做强化学习环境搭建,把服务卖给模型公司——尤其是编程、数学领域。还有产品公司在搭自己的强化学习环境,因为to B和SaaS产品发现通用模型的强化学习不够用。
更广义的,是那些传统数据标注公司。Meta收购了Scale AI,市场份额被Surge AI这类公司拿走。Surge AI的CEO说:「后训练优化是门艺术。」他们请法律专业人士、财务专业人士、工业界专家、科学家来做「数据标注」——今天叫强化学习环境搭建。
杨植麟前几天也说了类似观点:「强化学习环境搭建,本质上代表了品味。」
Sequoia写了一篇文章,标题只有四个字:2026类AGI。
他们认为,OpenAI定义的L1到L5阶段中,L1通过预训练解决了知识,L2通过后训练解决了推理,L3要解决的是持续迭代——也就是Agent。
衡量Agent的标准是:它能完成多长时长的任务。
Sequoia举了个例子:假设你要招一个强化学习环境搭建的核心研究员,Agent会怎么做?
它会在YouTube上找相关演讲,看演讲人是谁,再在Twitter搜这个人的技术影响力,挖一下这个人在哪工作、工作多久,分析他Twitter上的内容,看有没有离职意向,筛选符合标准的人员,给他们发邮件。
这个过程听起来不复杂,但传统猎头需要几天。现在一个Agent半小时就能完成。
红杉说:「这看起来就非常像我们理想中的AGI能力。」
问题来了。
下一代模型研究范式需要出现。硅谷的共识是:自主学习。Ilya在采访中说「我们需要打开新的研究时代」,余峻承在张小珺播客里说「research的再一次重要」。
如果真的实现了自主学习,OpenAI定义的L4(创新者)是不是就实现了?
这就解释了为什么最近半年美国出现一堆「new lab」——创始人来自头部模型公司,创业方向都是研究新范式或新可能性,在很短时间内拿了非常多钱。典型如Ilya的Safe Superintelligence、Noam Shazeer的Character.ai。
美国资本愿意赌,这些公司里可能出现下一代研究范式。
庄明浩在2024年6月做过一张PPT,标题是「AI的主桌只有一桌」。
当时他说:语言是最核心的一桌,coding是一桌,多模态是一桌。三桌。
但2025年下半年开始,他意识到:「可能只是一桌。」
他给儿子做了一次关于AI的演讲,让NotebookLM用《火影忍者》的故事来讲,再用《蛋仔派对》的故事来讲。NotebookLM完全理解两个世界发生了什么,把逻辑层关系和AI模型技术原理做了构建,然后以可视化方式展现。
「这让我非常吃惊。语言、多模态,甚至coding,可能是一桌。」
他给女儿幼儿园演讲做PPT,女儿想讲《三只小猪》。他拍了几张立体书的照片,在YouTube找到这本书的介绍,喂给NotebookLM。
生成的PPT,除了完全理解故事,画面设计也是那种「立体展现方式」——像木签贴在书上的样子。「它除了理解故事本身,还理解我想展示的动态样子。」
「开玩笑说,我把幼儿园家长演讲PPT提到了不应该有的高度。」
美国的「御三家」:Google、OpenAI、Anthropic。
Google在多模态断档式领先——图片、视频、NotebookLM,同时在硬件层面显示出非常强的能力。所以2025年12月关于「Google是否会侵蚀英伟达市场份额」的讨论特别多。
OpenAI在赌to C。ChatGPT能理解你是什么性格、偏好、职业,基于这个调整回答。它希望这能带来长期留存提升——看上去也带来了。
Anthropic非常简单:do to B,coding。你会明显感觉过去一个多月,Anthropic topic相关的coding内容占据版面特别多。
进入年底后,OpenAI已经不再领先了。OpenAI发GPT-5时领先位就不大了。下半年Google发Gemini 3时,大家都说Google已经反超。OpenAI亮了红灯。Meta的LLaMA已经完全掉队。
但最疯狂的不是模型。
是数据中心。
目前在运营的头部科技公司数据中心量级是2.26 GW(吉瓦)。但承诺出去的、在建的和未来规划的,已经达到35 GW。
2025年开始,数据中心建设进入非常疯狂的周期。这导致了存储芯片暴涨。标普500涨得最好的前五家公司,第一是三星,第二西部数据,第三美光,第四希捷,第五Robinhood——前四全是存储芯片公司。
庄明浩说:「这个趋势看上去26年依然会延续,甚至可能延续到27、28年。因为存储厂商垄断,受物理条件限制,从要件到生产线出第一批货需要两三年。现在的投入,两三年后才会看到效果。但你要考虑未来2-3年需求是不是会再疯涨,涨到预期又不够了呢?」
肉眼可见的未来4-5年,这个投入应该是2万亿美金左右体量。
老黄在上个季度财报说过:「未来4-5年有2万亿美金在数据中心上。」各种投行预期差不多也是这个数字。
问题来了:这个钱谁来出?
科技巨头自己的CapEx是大头,但可能只能出1万亿多。折旧有一部分,私人投资和信贷有一部分。剩余缺口哪来?
这就是今天时间点为什么会担心这件事情爆雷的核心议题。
Meta前两天公布财报,说明年把CapEx上调到160亿美金——这个钱基本等于它的自由现金流。那2027年怎么办?
所以2025年Q3到Q4开始,即使是最头部科技公司——亚马逊、Meta、Google、Oracle——都发了巨额债。
更要命的是折旧。英伟达现在卖的是A系列、H系列、B系列芯片。虽然大家说因为需求导致一个GPU折旧可以按六七年算,但如果按性能算,可能这个数据要折到四年、五年甚至三年。
每家公司投这么多钱买这么多卡,折旧摊销变成巨大负担。
前段时间美股AI模型公司、数据中心公司、能源公司有一波比较大调整。掉最多的是目前看上去杠杆最高的CoreWeave——疯狂举债的new cloud公司。
Oracle更有代表性。Q2公布一个巨大订单,Q3确认是五年3000亿美金,暴涨。但Q4大家开始算:你为了接这五年3000亿订单,要投入,要建数据中心,从2026年开始自由现金流不够。2026、2027、2028都不够。
Oracle股价先暴涨,然后一路跌回合同确认之前的股价。
「去年底有媒体写:Oracle这个3000亿订单的合同价值其实已经变成负数了。」
现在看中国。
庄明浩用了一个比喻:「如果有人问我『你讲的所有这些事情是不是太过于硅谷视角』,这可能是过去一年我听到的最刺耳的一句话。」
所以他讲了中国。
DeepSeek R1发布一年之后,「直到今天R1的影响依然被低估。在全世界范围内,很多地区都要感谢R1。尤其是经济欠发达地区,R1是他们很重要的模型获取方式。」
他强调:「我一定要在V4发布之前把PPT做完。因为V4发布之后大概率所有事情要重写一遍。这就是市场给DeepSeek的尊重。」
中美在模型上的对抗,成为核心议题。
2025年年中,中国开源模型领域的Hugging Face下载量已经超过美国模型。从模型表现能力看,Q3左右时候,中国开源模型能力就领先全世界了。
美国一直没有追上开源,成为某种共识。而且这种共识不仅在中国——欧洲的Mistral,英伟达、IBM、微软、Google都做了开源。
「所以就出现了一种竞争:开源跟闭源的竞争。」
今天这个时间点,世界上头部开源模型几乎全部都是中国公司:DeepSeek、千问、GLM(智谱)、MiniMax、小米、阿里、支付宝、美团、借阅。
一个美国智库发了论文说:「自2023年以来,中国人工智能模型平均落后于美国领先水平七个月。」
但你要知道,2023年以来已经过去两三年。平均七个月,就代表最近这个数字应该比七个月小。
千问在整个开源板块已经超过LLaMA。12月份统计里,单月下载量千问应该已经超过其他所有模型加在一起。
2026年,中国会发生什么?
第一,ChatBot战场会升级。
豆包日活破亿,今年是春晚赞助商。阿里不服,Q4开始疯狂推千问,千问Action发布会上宣布C端月活破亿(包括app和web)。腾讯在等机会,最近元宝上了新功能「元宝派」——群聊,AI参与聊天,可以一起看腾讯视频、听QQ音乐,发红包。
春节红包大战在AI时代再次上演:元宝10亿,百度51亿,豆包跟火山是央视春晚赞助商,千问推广应该也没有预算上限——今年集五福在阿福上集。
「大家又来了。我觉得也是好事。有竞争总比死气沉沉好得多。」
第二,多模态领域的竞争会更激烈。
图片榜单前30名,中国占11个。视频领域前30名,中国占19个——快手占六七个,字节、MiniMax、Pika、Pixverse占了19个。
应用端更繁荣:即梦、可灵、Pixverse、Viggle、海螺、美图、剪映。
字节、阿里、腾讯——新BAT在多模态领域都放了重兵。
第三,AI硬件可能是2025年中国VC最大的共识。
AI玩具、PLG、AI摄像头、学习机、吉他、人形机器人。AI玩具算是共识中的共识——CES上有超过40家中国AI玩具公司做展出。
但最关键的问题是:我们到底在山腰上还是山顶上?
庄明浩展示了一条曲线:市场周期的心理学曲线。它跟Gartner技术成熟度曲线几乎一模一样,甚至包括每一次泡沫破裂过程中的股票价值曲线也一样。
台积电上周发财报,董事长说了这样一段话:「我们把CapEx预期上调到520到560亿美金。如果我们不审慎对待,这对台积电来说将会是一场灾难。」
台积电历史上以冷静、理性到冷血著称。现在它上调超过30%的CapEx。
「过去3到4个月,我和我的客户以及客户的客户沟通——英伟达的客户是数据中心、模型公司、云厂商、Meta这样的应用公司——已确认需求是真实的。答案让我相当满意。」
台积电都这么说了。
整个链条上,我们已经不太信任应用公司——太小,毛利甚至是负的。我们也不太信任模型公司——营收规模刚才跟万亿美金之间差距太大。我们也不太信任云厂商——尤其那些new cloud公司,杠杆拉满。我们也不太信任英伟达——老黄怎么都是赚钱的。
「我们似乎只能去在台积电身上找信任感。这个市场现在不就是这个样子。」
这背后的理论,是系统演化的路径依赖。
中美都在用同一代大模型技术。预训练、后训练、强化学习、自主学习——技术路径高度一致。
但当技术进入产业组织和市场,差异出现了。
美国是「三角形倒置」:芯片层(英伟达)最赚钱,云层(AWS、Azure、GCP)其次,模型层再次,应用层最小。这是一个越往底层走、占据版面和钱越多的结构。
中国是「应用为王」:ChatBot日活过亿的有好几家,多模态应用遍地开花,AI硬件成为VC共识。这是一个越接近用户、越热闹的结构。
两种系统,两种逻辑。
庄明浩说:「到底这件事情是一厢情愿还是顺理成章?如果能往前走,我们就能看到越来越多跟用户更接近的公司越来越大。但所有这些事情,还是那个问题:一厢情愿还是顺理成章?」
他没有给答案。
181页PPT讲完了。屏幕上,标普500在创新高。