当AI开始为自己设计大脑:Ricursive如何用强化学习重塑芯片设计的千亿赛道
Physical AIAI Business

当AI开始为自己设计大脑:Ricursive如何用强化学习重塑芯片设计的千亿赛道

A
Anna Goldie & Abe Asfaw (Ricursive Intelligence创始人) | 主持人: Sequoia Capital
2026年5月6日YouTube
返回首页

金句精选

「芯片是AI的燃料,我们应该用AI来设计和优化芯片,从而在AI与其物理基底之间形成递归的自我改进闭环。」

「我们想开创'designless'时代——就像台积电让英伟达专注设计一样,让公司专注于应用层,把芯片设计本身交给我们。」

「我们把工具提速100,000倍,是因为AI模型需要快速迭代的反馈信号——如果每次仿真要等几天,AI根本没有机会学习。」

「AI生成的芯片布局看起来像有机体,弯曲而流动——物理设计工程师第一次看到时都震惊了,但这些'奇怪'的形状恰好性能最优。」

「即便只提升1%的芯片性能,对于以前沿模型规模运行推理的公司来说,也是一场巨大的胜利。」

一块芯片从设计到流片,通常需要数百名工程师耗费数年时间。而英伟达每推迟一天发货,就意味着约2.25亿美元的机会成本从指缝间流走。

这不是危言耸听,这是Anna Goldie在Sequoia活动现场引用的行业数字。她和联合创始人Azalia Mirhoseini站在台上,用十分钟讲清楚了一件事:芯片设计这个人类最精密的工程活动,正在被AI从根部重塑。

她们的公司叫Ricursive(原名Recursive Intelligence)。这个名字本身就是一个宣言。


一个在Nature发表、却在真实芯片上跑起来的研究

故事要从2018年说起。

那一年,Anna和Azalia在Google Brain启动了一个项目:用深度强化学习来解决芯片布局问题。所谓芯片布局,就是把数十亿个标准单元和晶体管放置在一块芯片画布上,再将它们全部连线——这是物理设计中最复杂、最耗时的环节之一。

她们训练了一个强化学习智能体。它学会了在芯片画布上做决策:这个模块放哪里,走线怎么绕,时序约束如何满足。

结果让人意外。这个智能体生成的布局,性能超过了人类专家。

更关键的是:它不只是一个论文结果。这项工作以「AlphaChip」之名发表在《Nature》上,但它真正的重量来自另一个事实——它被用在了Google真实的芯片流片上。谷歌最近四代TPU(AI加速器芯片)、Axion数据中心CPU、Pixel手机芯片、自动驾驶芯片,以及联发科的外部采用,AlphaChip的布局方案都在其中。

一个研究项目,从实验室直接跑进了支撑全球AI基础设施的硅片里。

Anna事后回忆,物理设计工程师第一次看到AI生成的布局时,反应是「震惊」。人类专家习惯做整齐、规则、网格状的排列;而AI生成的布局看起来像有机体——弯曲的、流动的、近似自然生长的形状。但这些「奇怪」的形状,恰好最小化了走线长度,提升了信号速度。

美,来自约束的极限解。


递归飞轮:AI设计芯片,芯片加速AI

Ricursive公司的核心命题,用Anna的原话来说是:「芯片是AI的燃料,我们应该用AI来设计、优化和自动化芯片设计流程,从而在AI与其物理基底之间形成一个递归的自我改进闭环。」

这句话值得拆开来看。

AI模型需要算力,算力来自芯片。如果AI能够设计出更好的芯片,新芯片就能训练出更强的AI,更强的AI又能设计出下一代更好的芯片——这个循环一旦启动,就不会自己停下来。

这正是「Recursive Intelligence」这个名字的由来:递归,不是程序语言里的概念,而是一种物理层面的自我增强机制。

但要让这个飞轮真正转起来,有一个绕不过去的瓶颈:现有的芯片设计工具,太慢了。


把工具提速100,000倍,才能喂饱AI

Azalia在演讲中展示了传统芯片设计流程的全貌:从架构设计,到物理设计,再到最终签核(sign-off)发送给晶圆厂——每一个环节都有商业EDA工具在跑,每次优化迭代可能需要数天时间。

「这些工具有时候一次优化迭代就要跑好几天。」

问题在于:AI模型的本质是在反馈循环中学习。强化学习智能体需要试错,需要高频迭代,需要快速获得奖励信号。如果每次仿真都要等几天,AI根本没有机会学习。

Ricursive的解法是:在用AI之前,先把工具本身重建一遍。

她们以静态时序分析(STA,Static Timing Analysis)为例——这是物理设计中最关键也最耗时的组件之一,用于验证芯片在特定时钟频率下能否正确工作。Ricursive自研了一个STA引擎,与商业工具保持高度一致的精度,同时将速度提升了1000倍。

1000倍的速度意味着什么?意味着AI可以在一天之内完成人类工程师需要三年才能尝试的优化路径数量。强化学习的外循环(outer loop)因此被彻底解锁:AI围绕这个快速工具不断调整策略,性能曲线在迭代中持续陡升。

这不是「把AI嵌入旧工具」的思路,而是「为AI重建整个工具链」。


三个阶段,从加速到颠覆

Ricursive对自己的路径有清晰的阶段规划。

第一阶段,是帮现有芯片厂商提速。当前芯片设计的两大瓶颈——物理设计和设计验证——各自可能消耗长达一年的时间,动辄涉及数百到数千名专家。Ricursive的目标是让这个过程更快、更便宜、更节能。

第二阶段,是民主化芯片设计。Anna描述的图景是:任何公司,只要有一个足够规模的计算工作负载,都可以提交给Ricursive,拿到一块专为这个工作负载定制的芯片,直到GDS2格式——即发往晶圆厂的制造文件。

这个设想的核心在于「无需自己拥有芯片设计团队」。就像fabless(无晶圆厂)模式让英伟达、苹果可以专注于芯片架构设计、把制造外包给台积电一样,Ricursive想要开创「designless」(无设计)模式——让公司专注于应用和模型,把芯片设计本身外包出去。

「我们想成为芯片设计的平台,让公司可以专注于应用层和模型层,我们来提供使这些应用成为可能的计算和硬件。」

第三阶段,则是垂直整合:如果Ricursive已经掌握快速设计高性能芯片的能力,为什么不自己造芯片、训练自己的模型,并将两者协同进化?那时能提供的性价比和能力,将是外部竞争者难以追及的。


「寒武纪大爆发」:为什么定制芯片的时代必然到来

Azalia在演讲中提出了一个判断:当前AI推理市场只有少数几种主流芯片,但未来需要的是一场「芯片寒武纪大爆发」。

理由是:不同的AI工作负载有截然不同的性能需求。训练大模型需要极高的矩阵运算吞吐量;端侧推理需要极低的功耗;实时视频处理需要低延迟;金融风控需要高并发……一块通用芯片不可能在所有维度上都最优。

而自定义芯片(custom silicon)的障碍一直是成本:设计一块专用芯片的代价太高,只有英伟达、苹果、谷歌这样的巨头才负担得起。

Ricursive要打破的,正是这道门槛。

当芯片设计可以被AI自动化,当一个工作负载描述可以直接生成制造文件,「专用芯片」就不再是大公司的特权。任何在特定规模上运行AI工作负载的企业,都能获得为自己量身定制的硅片。

即便只提升1%的性能,对于以前沿模型规模运行推理的公司来说,也是巨大的经济收益。


团队:LLM专家与芯片专家的罕见组合

Ricursive团队的构成本身就颇为反常。

Anna和Azalia各自有横跨Google Brain、Anthropic、DeepMind、斯坦福的履历。但公司的特殊性在于:她们将一批曾参与过Gemini、Grok等顶级大模型研发的LLM专家,与芯片设计领域的深度专家拼在了一起。

这两个群体通常生活在平行宇宙里。LLM工程师不了解EDA工具链的复杂性;芯片设计师不掌握强化学习和大规模模型训练的技巧。把他们放在同一个问题上,才能真正做到「跨栈协同设计」——而这恰恰是Ricursive方法论的核心。


写在最后

一个很容易被忽视的细节:Anna和Azalia将公司命名为「Recursive Intelligence」,然后又将其缩写为「Ricursive」——多了一个字母「i」。

这个「i」,站在Intelligence的位置上,也站在那个无限循环的自我提升结构的核心。

芯片造AI,AI造芯片。这个循环的每一圈,都比上一圈更快、更强。

当AI开始为自己设计大脑,我们可能正在见证一场没有终点的加速。


关键金句

金句1:「芯片是AI的燃料,我们应该用AI来设计和优化芯片,从而在AI与其物理基底之间形成递归的自我改进闭环。」 金句2:「我们想开创'designless'时代——就像台积电让英伟达专注设计一样,让公司专注于应用层,把芯片设计本身交给我们。」 金句3:「我们把工具提速100,000倍,是因为AI模型需要快速迭代的反馈信号——如果每次仿真要等几天,AI根本没有机会学习。」 金句4:「AI生成的芯片布局看起来像有机体,弯曲而流动——物理设计工程师第一次看到时都震惊了,但这些'奇怪'的形状恰好性能最优。」 金句5:「即便只提升1%的芯片性能,对于以前沿模型规模运行推理的公司来说,也是一场巨大的胜利。」