当AI学会「串联漏洞」:Anthropic的百日豪赌与硅谷的安全新共识
AI BusinessAI Principles

当AI学会「串联漏洞」:Anthropic的百日豪赌与硅谷的安全新共识

D
David Sacks, Chamath Palihapitiya, Jason Calacanis, David Friedberg | 主持人: All-In Podcast
2026年4月10日YouTube
返回首页

金句精选

「移动速度要快」这句话需要被重新定义——快,但要知道自己在开哪扇门。

两件事同时为真并不矛盾:这是正确的安全决策,也是精准的品牌叙事。

赛跑的另一端不是竞争对手的发布节点,而是某个不受Project Glasswing约束的行为者。

代码生产速度已经爆炸式增长,新漏洞的引入速度同样在加速——一次性清查解决不了持续涌入的问题。

当一个模型能把二十七年前埋下的缺陷和另外三个漏洞串联成一把可用的钥匙,「安全」就不再是发布后的附加选项。

一个模型,三种读法

六月初,Anthropic做了一件在硅谷颇为罕见的事:研发出新模型,却主动宣布不发布。

这个代号为Mythos的模型,据该公司描述,能够自主发现数千个软件漏洞,覆盖几乎所有主流操作系统与浏览器。更令人警觉的是,它不只是逐一找出单个漏洞,而是能将两个、三个、乃至五个看似无害的缺陷串联起来,构造出一条完整的攻击链——这在网络安全领域被称为「漏洞链式利用」,长期以来是顶级黑客才具备的能力。

Anthropic列举的案例颇具震撼力:一个潜伏了二十七年的OpenBSD漏洞,一个在ffmpeg代码库里躲过五百万次自动扫描、沉睡十六年的缺陷,以及散布在Linux内核中的若干隐患。面对这份清单,公司宣布启动「Project Glasswing」计划,联合Apple、Microsoft、Google、Amazon、JP Morgan等四十家头部企业,用一百天时间,在这些能力被广泛传播之前,先行修补漏洞、加固系统。

同一件事,在All-In播客的讨论中呈现出三种截然不同的读法。

信徒、怀疑者与务实派

Brad Gerstner是Anthropic的投资人,也是这件事最直接的背书者。他的逻辑简洁:一家公司在没有政府强制要求的情况下,主动选择不发布一个可以拉开竞争差距的模型,本身就是一种稀缺的行业自律。他把Mythos和OpenAI即将推出的「Spud」(首个基于Blackwell芯片训练的模型)并列,称之为「AGI模型」时代的开端——智能跃升幅度太大,不适合直接对公众发布。他认为,Anthropic的做法提供了一个可复制的蓝图:沙箱测试、防御联盟、有序推进,而非一刀切的政府管制。

David Sacks的态度更为复杂。他承认漏洞发现的逻辑是成立的——随着代码能力提升,模型发现安全缺陷的能力必然同步增强,这一窗口期确实存在。但他同时指出,Anthropic有一套成熟的「恐惧营销」模式:每次发布新模型,都会伴随一份描述最坏情形的研究报告。他提到大约一年前那份「勒索研究」:团队对模型提示超过两百次才得到想要的结果,而一年后,同等能力的开源模型已经遍地开花,却从未在现实中产生任何勒索事件。他的结论是:这次的网络安全警告比之前更接近真实,但判断它的框架依然是「哭狼人的可信度问题」。

Chamath Palihapitiya则更为直接,称之为「mostly theater」。他的参照点是2019年——当时Dario Amodei还在OpenAI,GPT-2以十五亿参数被描述为「末日模型」,结果六个月的谨慎发布走完之后,什么都没发生。他的核心质疑不在于漏洞是否存在,而在于修复的可行性:如果这些漏洞真的如此普遍且严重,彻底修复可能需要关闭互联网数年,一百天能做什么?他还指出,如果真的是「末日级别」的威胁,为什么入选的四十家公司里没有核电站运营商、没有航空公司?这个圆子画得太小了。

三种读法,没有一种是完全错的。

百日能做什么

一百天,大约是三个月多一点。

这个时间窗口的实际价值,取决于你怎么理解它的目标。如果目标是「修复互联网上所有潜在漏洞」,那Chamath是对的,这是不可能完成的任务。但如果目标是「在攻击能力被广泛扩散之前,让最重要的代码库完成一轮AI驱动的安全扫描」,那这一百天就具有真实意义。

Sacks提出了一个有用的时间框架:中国的开源模型(他提到了GIMMI K2)大约落后六个月。这意味着存在一个有限的窗口,在这个窗口内,具备Mythos级别漏洞发现能力的工具只掌握在少数人手中。在这六个月里推动核心代码库完成扫描和修补,是有实际价值的行动。

Brad在讨论中提到一个更深层的背景:因为AI编程工具的普及,当前各组织推送的代码量已经是过去的十倍乃至百倍。代码生产速度的爆炸式增长,意味着新漏洞的引入速度同样在加速。在这个意义上,把安全检测能力嵌入编程工具本身,做到实时修正,才是真正的解题方向,而不只是针对历史遗留漏洞做一次性清查。

自律的边界与商业的逻辑

这场讨论里有一条隐线,没有被明说,但始终存在:Anthropic在做正确的事,同时也在做对自己有利的事。

OpenClaw事件把这条线拉到了明处。OpenClaw是GitHub历史上增长最快的开源项目之一,它的用户用二百美元的订阅消耗了价值数千乃至数万美元的计算资源。Anthropic的处理方式是:切断OpenClaw用户通过订阅方式使用Claude的通道,要求他们改用按量计费的API。与此同时,Anthropic自己推出了功能类似的原生Agent工具,目前处于封闭测试阶段,定价尚未公布。

问题就在这里:如果Anthropic对自家Agent工具采用打包定价,对第三方工具采用按量计费,那就构成了典型的捆绑销售模式。在Anthropic已经在编程领域占据主导地位的前提下,这可能触及反垄断的边界。这不是阴谋论,而是一个需要持续观察的商业结构问题。

回到Mythos。扣押模型本身,是一个同时满足安全逻辑和商业逻辑的决策。安全层面,它确实给了行业一个修补窗口;商业层面,它制造了稀缺感,强化了「Anthropic是最负责任的AI公司」的品牌叙事,同时为即将推出的企业级安全产品铺路。两件事同时为真,并不矛盾。

那个真正重要的问题

讨论到最后,Jason Calacanis抛出了一个被其他人轻轻带过的问题:如果Mythos真的具备这种能力,中国是否已经有了等效的工具?

这个问题没有确定的答案,但它指向了整个讨论的真正核心。Anthropic的百日计划,无论动机如何混杂,本质上是一场时间赛跑。赛跑的另一端不是竞争对手的发布节点,而是某个不受Project Glasswing约束的行为者,在这个窗口期结束之前,用同等能力做出不同的选择。

Brad表示,他确信Dario已经和CIA进行了沟通。Frontier Model Forum——由Google、OpenAI、Anthropic等头部公司在2023年共同建立的协调机制——正在进行对抗性蒸馏方面的合作,目的是不让这些能力轻易被复制和扩散。这些都是真实存在的防线,但它们的有效性,最终取决于执行速度和参与者的诚意。

一百天之后,我们会知道更多。

现在能确定的只有一件事:当一个模型能够自主发现二十七年前埋下的漏洞,并把它和另外三个缺陷串联成一把可用的钥匙,「移动速度要快」这句话就需要被重新定义了——快,但要知道自己在开哪扇门。