庄明浩:同一代技术,两个系统——181页PPT全记录2025中美AI并行展开
AI BusinessAI OrganizationAI Principles

庄明浩:同一代技术,两个系统——181页PPT全记录2025中美AI并行展开

庄明浩(独白/演讲)
2026年1月29日小宇宙
返回首页

金句精选

我们过去对AI的分类,全错了。AI的主桌,只有一张。

文字、图片、视频、代码,在AI眼里,其实是一张桌子上的菜。

技能壁垒正在消失,认知壁垒正在被无限拔高。

不要再觉得自己是文科生就不碰代码,你其实是一个被代码耽误的产品经理。

AI革命尚未成功,但留给"等等党"的时间,真的不多了。

庄明浩做了181页PPT。

这是他历史上页数最多的一次演讲。2026年1月底,他用这份PPT复盘了2025年AI行业发生的一切。标题只有九个字:同一代技术,两个系统。

如果你还在把中美AI竞争理解为「谁的模型更强」,你可能忽略了真正的分水岭:同一代大模型技术下,两个国家正在展开完全不同的系统演化。


庄明浩说,2025年不再只是能力的竞赛,而是系统的展开。

「在同一代大模型技术约束之下,美国与中国几乎同时走向了相似的方向:更大的算力投入、更激进的资本趋势、更一致的技术想象。但当这些技术真正进入产业组织与市场,差异开始显现。」

这是两套系统在同一时间各自展开的过程。


先看美国。

2025年,模型发布按周计算。DeepSeek R1、GPT-4.5、Claude 4、Gemini 2.5、Gemini 3、视频模型Veo 3、Banana、可灵、海螺。每周都有头部厂商发新模型。

但庄明浩的第一个观察是:「2025年是资源投入从预训练转向后训练的元年。」

以前,大家把资源砸在预训练上——喂数据、扩参数。现在,预训练按Sam Altman的说法「可能已经挖到70-80%了」,边际效应显著变差。

所以资源转向后训练:强化学习环境搭建、任务设置、模型表现打分。这是肉眼可见中短期内模型厂商都要做的重投入。

谁在搭建这些强化学习环境?

除了模型厂商自己,美国出现了一批初创公司,专门只做强化学习环境搭建,把服务卖给模型公司——尤其是编程、数学领域。还有产品公司在搭自己的强化学习环境,因为to B和SaaS产品发现通用模型的强化学习不够用。

更广义的,是那些传统数据标注公司。Meta收购了Scale AI,市场份额被Surge AI这类公司拿走。Surge AI的CEO说:「后训练优化是门艺术。」他们请法律专业人士、财务专业人士、工业界专家、科学家来做「数据标注」——今天叫强化学习环境搭建。

杨植麟前几天也说了类似观点:「强化学习环境搭建,本质上代表了品味。」


Sequoia写了一篇文章,标题只有四个字:2026类AGI。

他们认为,OpenAI定义的L1到L5阶段中,L1通过预训练解决了知识,L2通过后训练解决了推理,L3要解决的是持续迭代——也就是Agent。

衡量Agent的标准是:它能完成多长时长的任务。

Sequoia举了个例子:假设你要招一个强化学习环境搭建的核心研究员,Agent会怎么做?

它会在YouTube上找相关演讲,看演讲人是谁,再在Twitter搜这个人的技术影响力,挖一下这个人在哪工作、工作多久,分析他Twitter上的内容,看有没有离职意向,筛选符合标准的人员,给他们发邮件。

这个过程听起来不复杂,但传统猎头需要几天。现在一个Agent半小时就能完成。

红杉说:「这看起来就非常像我们理想中的AGI能力。」

问题来了。

下一代模型研究范式需要出现。硅谷的共识是:自主学习。Ilya在采访中说「我们需要打开新的研究时代」,余峻承在张小珺播客里说「research的再一次重要」。

如果真的实现了自主学习,OpenAI定义的L4(创新者)是不是就实现了?

这就解释了为什么最近半年美国出现一堆「new lab」——创始人来自头部模型公司,创业方向都是研究新范式或新可能性,在很短时间内拿了非常多钱。典型如Ilya的Safe Superintelligence、Noam Shazeer的Character.ai。

美国资本愿意赌,这些公司里可能出现下一代研究范式。


庄明浩在2024年6月做过一张PPT,标题是「AI的主桌只有一桌」。

当时他说:语言是最核心的一桌,coding是一桌,多模态是一桌。三桌。

但2025年下半年开始,他意识到:「可能只是一桌。」

他给儿子做了一次关于AI的演讲,让NotebookLM用《火影忍者》的故事来讲,再用《蛋仔派对》的故事来讲。NotebookLM完全理解两个世界发生了什么,把逻辑层关系和AI模型技术原理做了构建,然后以可视化方式展现。

「这让我非常吃惊。语言、多模态,甚至coding,可能是一桌。」

他给女儿幼儿园演讲做PPT,女儿想讲《三只小猪》。他拍了几张立体书的照片,在YouTube找到这本书的介绍,喂给NotebookLM。

生成的PPT,除了完全理解故事,画面设计也是那种「立体展现方式」——像木签贴在书上的样子。「它除了理解故事本身,还理解我想展示的动态样子。」

「开玩笑说,我把幼儿园家长演讲PPT提到了不应该有的高度。」


美国的「御三家」:Google、OpenAI、Anthropic。

Google在多模态断档式领先——图片、视频、NotebookLM,同时在硬件层面显示出非常强的能力。所以2025年12月关于「Google是否会侵蚀英伟达市场份额」的讨论特别多。

OpenAI在赌to C。ChatGPT能理解你是什么性格、偏好、职业,基于这个调整回答。它希望这能带来长期留存提升——看上去也带来了。

Anthropic非常简单:do to B,coding。你会明显感觉过去一个多月,Anthropic topic相关的coding内容占据版面特别多。

进入年底后,OpenAI已经不再领先了。OpenAI发GPT-5时领先位就不大了。下半年Google发Gemini 3时,大家都说Google已经反超。OpenAI亮了红灯。Meta的LLaMA已经完全掉队。


但最疯狂的不是模型。

是数据中心。

目前在运营的头部科技公司数据中心量级是2.26 GW(吉瓦)。但承诺出去的、在建的和未来规划的,已经达到35 GW。

2025年开始,数据中心建设进入非常疯狂的周期。这导致了存储芯片暴涨。标普500涨得最好的前五家公司,第一是三星,第二西部数据,第三美光,第四希捷,第五Robinhood——前四全是存储芯片公司。

庄明浩说:「这个趋势看上去26年依然会延续,甚至可能延续到27、28年。因为存储厂商垄断,受物理条件限制,从要件到生产线出第一批货需要两三年。现在的投入,两三年后才会看到效果。但你要考虑未来2-3年需求是不是会再疯涨,涨到预期又不够了呢?」

肉眼可见的未来4-5年,这个投入应该是2万亿美金左右体量。

老黄在上个季度财报说过:「未来4-5年有2万亿美金在数据中心上。」各种投行预期差不多也是这个数字。

问题来了:这个钱谁来出?


科技巨头自己的CapEx是大头,但可能只能出1万亿多。折旧有一部分,私人投资和信贷有一部分。剩余缺口哪来?

这就是今天时间点为什么会担心这件事情爆雷的核心议题。

Meta前两天公布财报,说明年把CapEx上调到160亿美金——这个钱基本等于它的自由现金流。那2027年怎么办?

所以2025年Q3到Q4开始,即使是最头部科技公司——亚马逊、Meta、Google、Oracle——都发了巨额债。

更要命的是折旧。英伟达现在卖的是A系列、H系列、B系列芯片。虽然大家说因为需求导致一个GPU折旧可以按六七年算,但如果按性能算,可能这个数据要折到四年、五年甚至三年。

每家公司投这么多钱买这么多卡,折旧摊销变成巨大负担。

前段时间美股AI模型公司、数据中心公司、能源公司有一波比较大调整。掉最多的是目前看上去杠杆最高的CoreWeave——疯狂举债的new cloud公司。

Oracle更有代表性。Q2公布一个巨大订单,Q3确认是五年3000亿美金,暴涨。但Q4大家开始算:你为了接这五年3000亿订单,要投入,要建数据中心,从2026年开始自由现金流不够。2026、2027、2028都不够。

Oracle股价先暴涨,然后一路跌回合同确认之前的股价。

「去年底有媒体写:Oracle这个3000亿订单的合同价值其实已经变成负数了。」


现在看中国。

庄明浩用了一个比喻:「如果有人问我『你讲的所有这些事情是不是太过于硅谷视角』,这可能是过去一年我听到的最刺耳的一句话。」

所以他讲了中国。

DeepSeek R1发布一年之后,「直到今天R1的影响依然被低估。在全世界范围内,很多地区都要感谢R1。尤其是经济欠发达地区,R1是他们很重要的模型获取方式。」

他强调:「我一定要在V4发布之前把PPT做完。因为V4发布之后大概率所有事情要重写一遍。这就是市场给DeepSeek的尊重。」

中美在模型上的对抗,成为核心议题。

2025年年中,中国开源模型领域的Hugging Face下载量已经超过美国模型。从模型表现能力看,Q3左右时候,中国开源模型能力就领先全世界了。

美国一直没有追上开源,成为某种共识。而且这种共识不仅在中国——欧洲的Mistral,英伟达、IBM、微软、Google都做了开源。

「所以就出现了一种竞争:开源跟闭源的竞争。」

今天这个时间点,世界上头部开源模型几乎全部都是中国公司:DeepSeek、千问、GLM(智谱)、MiniMax、小米、阿里、支付宝、美团、借阅。

一个美国智库发了论文说:「自2023年以来,中国人工智能模型平均落后于美国领先水平七个月。」

但你要知道,2023年以来已经过去两三年。平均七个月,就代表最近这个数字应该比七个月小。

千问在整个开源板块已经超过LLaMA。12月份统计里,单月下载量千问应该已经超过其他所有模型加在一起。


2026年,中国会发生什么?

第一,ChatBot战场会升级。

豆包日活破亿,今年是春晚赞助商。阿里不服,Q4开始疯狂推千问,千问Action发布会上宣布C端月活破亿(包括app和web)。腾讯在等机会,最近元宝上了新功能「元宝派」——群聊,AI参与聊天,可以一起看腾讯视频、听QQ音乐,发红包。

春节红包大战在AI时代再次上演:元宝10亿,百度51亿,豆包跟火山是央视春晚赞助商,千问推广应该也没有预算上限——今年集五福在阿福上集。

「大家又来了。我觉得也是好事。有竞争总比死气沉沉好得多。」

第二,多模态领域的竞争会更激烈。

图片榜单前30名,中国占11个。视频领域前30名,中国占19个——快手占六七个,字节、MiniMax、Pika、Pixverse占了19个。

应用端更繁荣:即梦、可灵、Pixverse、Viggle、海螺、美图、剪映。

字节、阿里、腾讯——新BAT在多模态领域都放了重兵。

第三,AI硬件可能是2025年中国VC最大的共识。

AI玩具、PLG、AI摄像头、学习机、吉他、人形机器人。AI玩具算是共识中的共识——CES上有超过40家中国AI玩具公司做展出。


但最关键的问题是:我们到底在山腰上还是山顶上?

庄明浩展示了一条曲线:市场周期的心理学曲线。它跟Gartner技术成熟度曲线几乎一模一样,甚至包括每一次泡沫破裂过程中的股票价值曲线也一样。

台积电上周发财报,董事长说了这样一段话:「我们把CapEx预期上调到520到560亿美金。如果我们不审慎对待,这对台积电来说将会是一场灾难。」

台积电历史上以冷静、理性到冷血著称。现在它上调超过30%的CapEx。

「过去3到4个月,我和我的客户以及客户的客户沟通——英伟达的客户是数据中心、模型公司、云厂商、Meta这样的应用公司——已确认需求是真实的。答案让我相当满意。」

台积电都这么说了。

整个链条上,我们已经不太信任应用公司——太小,毛利甚至是负的。我们也不太信任模型公司——营收规模刚才跟万亿美金之间差距太大。我们也不太信任云厂商——尤其那些new cloud公司,杠杆拉满。我们也不太信任英伟达——老黄怎么都是赚钱的。

「我们似乎只能去在台积电身上找信任感。这个市场现在不就是这个样子。」


这背后的理论,是系统演化的路径依赖。

中美都在用同一代大模型技术。预训练、后训练、强化学习、自主学习——技术路径高度一致。

但当技术进入产业组织和市场,差异出现了。

美国是「三角形倒置」:芯片层(英伟达)最赚钱,云层(AWS、Azure、GCP)其次,模型层再次,应用层最小。这是一个越往底层走、占据版面和钱越多的结构。

中国是「应用为王」:ChatBot日活过亿的有好几家,多模态应用遍地开花,AI硬件成为VC共识。这是一个越接近用户、越热闹的结构。

两种系统,两种逻辑。

庄明浩说:「到底这件事情是一厢情愿还是顺理成章?如果能往前走,我们就能看到越来越多跟用户更接近的公司越来越大。但所有这些事情,还是那个问题:一厢情愿还是顺理成章?」

他没有给答案。

181页PPT讲完了。屏幕上,标普500在创新高。