Cursor是目前最受瞩目的AI编程工具之一,但它的模型策略却反其道而行之——不自己搞预训练。
为什么?
Cursor团队的回答很简洁:"从上往下想,而不是从下往上。"
什么意思?
传统的AI公司思维是:先搞定预训练,再搞定微调,再搞定强化学习,最后才能把产品推给用户。这条路漫长且烧钱,等模型到了用户手里,可能已经错过了最佳窗口期。
Cursor的思路完全相反:先问自己——"怎样才能在最短时间内给用户一个有用的模型?"
答案就是:跳过底层基础设施(预训练),直接在已有模型基础上做强化学习和后训练优化。这样一来,产品到用户手中的时间大幅缩短。
这不是"偷懒",而是工程资源的最优分配。对Cursor来说,核心价值不在于"我有一个从零训练的模型",而在于"我能让模型在编程场景下表现得比任何人都好"。
关键洞察:
- 自下而上(预训练→微调→RL):周期长、投入大、用户等待久
- 自上而下(用户需求→RL优化→微调):周期短、见效快、用户立即受益
这也解释了为什么Cursor选择了和Fireworks合作训练自己的Composer模型——专注于强化学习阶段,把基础模型能力交给合作伙伴,自己则集中精力在"让模型为用户服务"这一最关键环节上。
在AI产品竞争日益激烈的今天,"从上往下想"可能比"从下往上建"更聪明。
