降噪 - AI精选内容平台

英伟达年度GTC大会结束后，All-In播客主持人Jason Calacanis在现场连续专访了四位AI公司CEO——CoreWeave的Michael Intrator、Perplexity的Aravind Srinivas、Mistral的Arthur Mensch，以及澳大利亚数据中心巨头IREN的Daniel Roberts。这场对话没有PPT，没有预设稿，只有一线从业者对AI算力现实处境的直接判断。

从以太坊矿机到超算：CoreWeave的风险管理哲学

CoreWeave创始人Michael Intrator的创业史本身就是一个反常识的故事。他原本是一名做天然气算法对冲基金的量化交易员。2017年，他拿着管理资产剩余的"空档期"开始挖以太坊，原因极其务实：比特币的ASIC矿机已经被专业工程师牢牢把控，GPU矿机则可以灵活复用，"从一开始我们就把算力视为一种期权"。

从加密货币挖矿，到CGI渲染，到医学研究批处理，CoreWeave一步步沿着GPU应用复杂度攀升。2020年前后，他们买了一批A100捐给一个名叫Eleuther AI的开源项目组——用意颇为精明：既然是免费捐的，对方就没资格抱怨服务质量。这些志愿研究员后来各回原职，却一致向雇主推荐CoreWeave的基础设施，由此打开了B端市场。

Intrator在融资结构上同样不拘一格。他们创造了一种叫"box"的项目融资机制：把一份微软这类大客户的长期合同、对应的GPU采购合同和数据中心租约放入同一个独立法律实体，让合同现金流直接流向这个"盒子"，按优先级支付数据中心费用、利息和本金，剩余才归CoreWeave。这种结构让最保守的机构贷款人也能看清现金流模型，从而接受融资。18个月内，CoreWeave借助这一机制筹集了350亿美元。更关键的是，随着他们持续按约还款，融资成本在两年内下降了600个基点，正在向超大型云厂商的借贷成本靠拢。

对于外界关于GPU折旧的争论，Intrator毫不客气："说GPU 16个月就淘汰，那是有做空仓位的交易员在散布噪音。"CoreWeave的客户签的是五年合同，公司账上用六年折旧。A100今年的二手价格甚至比一年前还高，因为新入场的中小公司正在抢购它们。他打了个比方：你觉得没人要iPhone 12，但在南美和非洲，人们抢着花50美元买一台，用得好好的。

Perplexity：模型不是产品，"指挥家"才是

Perplexity的Aravind Srinivas把公司定位说得很清晰：我们不是在押注某一家模型，我们是管弦乐团的指挥。GPT赢、Claude赢、Gemini赢，对Perplexity都无所谓，因为它同时接入所有主流模型，并且能根据任务自动路由到最合适的那个。

三年半来，Perplexity一直围绕"准确性"构建信任。搜索产品给AI接入互联网以提升准确性；Comet浏览器让AI直接操控浏览器以完成准确的网络任务；最新推出的Computer则把AI变成一台能自主完成计算机操作的系统——"AI本身就是那台电脑"。

在商业模式上，Srinivas特别强调一点：Perplexity每一分钱收入都有正毛利。企业版分两档，每人每月40美元和400美元，后者为企业节省的成本已超过1亿美元。他解释，由于有检索增强和模型路由，Perplexity不需要把每个问题都打进最贵模型的最大上下文窗口，因此token成本远低于纯粹卖token的竞争对手。

他们正在开发"Personal Computer"产品：将服务器端的Computer与本地Mac Mini联动，私密数据的AI推理在本地硬件上跑，复杂任务可选择上传服务器，整套部署只需安装一个可执行文件。"没人需要学会写提示词，没人需要管理API密钥，没人需要在100个服务账单之间来回切换。"

Mistral：开源模型是企业数据主权的唯一解

Mistral CEO Arthur Mensch的核心论断是：闭源模型无法真正服务于最关键的企业场景。当制造商、金融机构手握数十年积累的专有数据时，把数据传给云端闭源模型存在数据主权风险——而开源模型可以被部署到客户自己的基础设施上，数据根本不需要离开。

Mistral的做法是派遣工程师团队驻场，和客户的领域专家一起工作，理解具体任务的数据逻辑，再在客户的本地环境里完成微调训练。他举例，与芯片制造商ASML合作时，团队要先搞懂半导体检测图像里的缺陷判断逻辑，才能指导数据标注和模型训练。

他也直接回应了合成数据的争议：合成数据适合做"知识蒸馏"的热身阶段——用大模型生成数据来训练小模型，但终归需要人类信号。"合成数据是提高训练效率的工具，不是替代人类反馈的方案。"

IREN：算力的物理约束比GPU短缺更难解

IREN联合创始人Daniel Roberts从另一个维度展示了AI基础设施的现实：算力瓶颈已经从GPU转移到电力和施工工期。他们在德克萨斯西部建设的旗舰数据中心设计容量750兆瓦，四年前这个数字在业界"闻所未闻"。目前IREN持有4.5吉瓦的电力容量——他说，"这几乎相当于整个旧金山湾区全年的用电量"。

与微软签订的97亿美元合同，只占IREN产能的5%。Roberts说，现在整个行业的核心矛盾是"time to compute"：电力有了，但要把数据中心物理建起来，需要数千名电工、建筑工人和HVAC技术员，而这些人本身就是全美最稀缺的资源。他提到，IREN会优先在传统重工业衰落的地区选址，那里有存量电力基础设施，也有需要再就业的本地工人。

IREN从创立起就坚持100%可再生能源——德克萨斯西部有40至50吉瓦的风能和太阳能装机，但输往达拉斯、休斯顿的输电线路容量只有12吉瓦。"我们直接去找那些电力过剩的源头，把它变成数字商品，以光速输出。"对于未来的SMR小型模块堆核电，他判断仍需十年，但现在是启动政策和资本布局的时机。

对于算力需求会否放缓，Roberts给出了一个简洁的反驳：今天用ChatGPT生成一张图需要两分钟，如果算力提升10倍、生成时间降到5秒，人们会生成更多图，还是更少？这是杰文斯悖论——效率提升催生更大需求，算力扩张不会导致需求饱和，而会带来需求爆发。

四位CEO的判断在一个基本点上高度一致：当前的算力供给远不能满足需求，而且需求不是线性增长，是自我强化的正反馈。从融资结构到开源策略，从本地算力到西德克萨斯的沙漠数据中心，这场竞赛的真实战场比任何技术路线图都要具体和粗粝。

AI基础设施的真实战场：四位CEO在英伟达GTC的直言实录

金句精选

从以太坊矿机到超算：CoreWeave的风险管理哲学

Perplexity：模型不是产品，"指挥家"才是

Mistral：开源模型是企业数据主权的唯一解

IREN：算力的物理约束比GPU短缺更难解