英伟达年度GTC大会结束后,All-In播客主持人Jason Calacanis在现场连续专访了四位AI公司CEO——CoreWeave的Michael Intrator、Perplexity的Aravind Srinivas、Mistral的Arthur Mensch,以及澳大利亚数据中心巨头IREN的Daniel Roberts。这场对话没有PPT,没有预设稿,只有一线从业者对AI算力现实处境的直接判断。
从以太坊矿机到超算:CoreWeave的风险管理哲学
CoreWeave创始人Michael Intrator的创业史本身就是一个反常识的故事。他原本是一名做天然气算法对冲基金的量化交易员。2017年,他拿着管理资产剩余的"空档期"开始挖以太坊,原因极其务实:比特币的ASIC矿机已经被专业工程师牢牢把控,GPU矿机则可以灵活复用,"从一开始我们就把算力视为一种期权"。
从加密货币挖矿,到CGI渲染,到医学研究批处理,CoreWeave一步步沿着GPU应用复杂度攀升。2020年前后,他们买了一批A100捐给一个名叫Eleuther AI的开源项目组——用意颇为精明:既然是免费捐的,对方就没资格抱怨服务质量。这些志愿研究员后来各回原职,却一致向雇主推荐CoreWeave的基础设施,由此打开了B端市场。
Intrator在融资结构上同样不拘一格。他们创造了一种叫"box"的项目融资机制:把一份微软这类大客户的长期合同、对应的GPU采购合同和数据中心租约放入同一个独立法律实体,让合同现金流直接流向这个"盒子",按优先级支付数据中心费用、利息和本金,剩余才归CoreWeave。这种结构让最保守的机构贷款人也能看清现金流模型,从而接受融资。18个月内,CoreWeave借助这一机制筹集了350亿美元。更关键的是,随着他们持续按约还款,融资成本在两年内下降了600个基点,正在向超大型云厂商的借贷成本靠拢。
对于外界关于GPU折旧的争论,Intrator毫不客气:"说GPU 16个月就淘汰,那是有做空仓位的交易员在散布噪音。"CoreWeave的客户签的是五年合同,公司账上用六年折旧。A100今年的二手价格甚至比一年前还高,因为新入场的中小公司正在抢购它们。他打了个比方:你觉得没人要iPhone 12,但在南美和非洲,人们抢着花50美元买一台,用得好好的。
Perplexity:模型不是产品,"指挥家"才是
Perplexity的Aravind Srinivas把公司定位说得很清晰:我们不是在押注某一家模型,我们是管弦乐团的指挥。GPT赢、Claude赢、Gemini赢,对Perplexity都无所谓,因为它同时接入所有主流模型,并且能根据任务自动路由到最合适的那个。
三年半来,Perplexity一直围绕"准确性"构建信任。搜索产品给AI接入互联网以提升准确性;Comet浏览器让AI直接操控浏览器以完成准确的网络任务;最新推出的Computer则把AI变成一台能自主完成计算机操作的系统——"AI本身就是那台电脑"。
在商业模式上,Srinivas特别强调一点:Perplexity每一分钱收入都有正毛利。企业版分两档,每人每月40美元和400美元,后者为企业节省的成本已超过1亿美元。他解释,由于有检索增强和模型路由,Perplexity不需要把每个问题都打进最贵模型的最大上下文窗口,因此token成本远低于纯粹卖token的竞争对手。
他们正在开发"Personal Computer"产品:将服务器端的Computer与本地Mac Mini联动,私密数据的AI推理在本地硬件上跑,复杂任务可选择上传服务器,整套部署只需安装一个可执行文件。"没人需要学会写提示词,没人需要管理API密钥,没人需要在100个服务账单之间来回切换。"
Mistral:开源模型是企业数据主权的唯一解
Mistral CEO Arthur Mensch的核心论断是:闭源模型无法真正服务于最关键的企业场景。当制造商、金融机构手握数十年积累的专有数据时,把数据传给云端闭源模型存在数据主权风险——而开源模型可以被部署到客户自己的基础设施上,数据根本不需要离开。
Mistral的做法是派遣工程师团队驻场,和客户的领域专家一起工作,理解具体任务的数据逻辑,再在客户的本地环境里完成微调训练。他举例,与芯片制造商ASML合作时,团队要先搞懂半导体检测图像里的缺陷判断逻辑,才能指导数据标注和模型训练。
他也直接回应了合成数据的争议:合成数据适合做"知识蒸馏"的热身阶段——用大模型生成数据来训练小模型,但终归需要人类信号。"合成数据是提高训练效率的工具,不是替代人类反馈的方案。"
IREN:算力的物理约束比GPU短缺更难解
IREN联合创始人Daniel Roberts从另一个维度展示了AI基础设施的现实:算力瓶颈已经从GPU转移到电力和施工工期。他们在德克萨斯西部建设的旗舰数据中心设计容量750兆瓦,四年前这个数字在业界"闻所未闻"。目前IREN持有4.5吉瓦的电力容量——他说,"这几乎相当于整个旧金山湾区全年的用电量"。
与微软签订的97亿美元合同,只占IREN产能的5%。Roberts说,现在整个行业的核心矛盾是"time to compute":电力有了,但要把数据中心物理建起来,需要数千名电工、建筑工人和HVAC技术员,而这些人本身就是全美最稀缺的资源。他提到,IREN会优先在传统重工业衰落的地区选址,那里有存量电力基础设施,也有需要再就业的本地工人。
IREN从创立起就坚持100%可再生能源——德克萨斯西部有40至50吉瓦的风能和太阳能装机,但输往达拉斯、休斯顿的输电线路容量只有12吉瓦。"我们直接去找那些电力过剩的源头,把它变成数字商品,以光速输出。"对于未来的SMR小型模块堆核电,他判断仍需十年,但现在是启动政策和资本布局的时机。
对于算力需求会否放缓,Roberts给出了一个简洁的反驳:今天用ChatGPT生成一张图需要两分钟,如果算力提升10倍、生成时间降到5秒,人们会生成更多图,还是更少?这是杰文斯悖论——效率提升催生更大需求,算力扩张不会导致需求饱和,而会带来需求爆发。
四位CEO的判断在一个基本点上高度一致:当前的算力供给远不能满足需求,而且需求不是线性增长,是自我强化的正反馈。从融资结构到开源策略,从本地算力到西德克萨斯的沙漠数据中心,这场竞赛的真实战场比任何技术路线图都要具体和粗粝。
