Andrej Karpathy:从Vibe编程到智能体工程
AI PrinciplesAI Coding

Andrej Karpathy:从Vibe编程到智能体工程

A
Andrej Karpathy - 现代AI的建设者、解释者和推动者,OpenAI联合创始人,特斯拉Autopilot项目负责人 | 主持人: Sequoia Capital主持人
2026年4月29日YouTube
返回首页

金句精选

我从未像现在这样感到作为程序员落伍了

12月是一个明确的转折点,最新的模型生成的代码块直接可用,我不记得上次还需要修正它是什么时候

Software 1.0是显式规则编程,Software 2.0是通过数据集和神经网络训练编程,Software 3.0是通过提示词和上下文窗口编程

在Software 3.0范式中,你不必精确拼写所有细节,智能体拥有自己的智能来执行任务、调试问题,这要强大得多

人们需要重新思考框架,不要在现有范式中工作,不要仅仅把它看作现有事物的加速,而是全新的可能性已经出现

「我从来没有像现在这样,觉得自己已经落后于AI时代。」

当Andre Karpathy——这个一手参与OpenAI创建、让特斯拉自动驾驶真正上路、亲自提出「Vibe Coding」理念的顶级AI工程师——在公开场合说出这句话时,现场鸦雀无声。对于许多人来说,他是AI领域的先驱和布道者,可如今,连他也坦言自己“追不上了”。

1. 震撼时刻:AI进化的断崖式跃迁

如果说2023年大家还在用ChatGPT写点小段代码,纠正下语法错误,那么到了去年12月,Andre突然发现自己几乎不再需要纠错——AI生成的代码越来越准确,越来越可靠,越来越像一个「编程搭档」。他回忆道:

「我甚至已经记不清上一次手动纠正AI生成的代码是什么时候了。AI变得如此可信,我只需要不断地给出新的指令,它就能持续产出正确的结果。」

那一刻,他体会到从“辅助工具”到“智能体”的根本切换。过去AI是你手中的一把瑞士军刀,现在它已悄然成为你的隐形合伙人,甚至在某些领域跑在你前面。

2. 软件3.0:代码、数据、提示词,哪个才是核心?

Andre把AI驱动的软件进化分为三个阶段:

  • 软件1.0:人写代码,规则明确,程序员主导一切。
  • 软件2.0:人设计数据集和目标,让神经网络通过训练自学能力。
  • 软件3.0:提示词和上下文才是「新代码」,AI模型成为真正的“可编程计算机”。

他举了一个菜单识别的例子。过去,如果你想让AI识别餐厅菜单,得开发一个复杂的OCR应用,前端后端一大堆代码。现在,只需拍张照片,扔给Gemini这样的AI,再用另一个AI工具(比如Nanobanana)做图像叠加,几乎不需要写任何“传统意义上的代码”。

「我以前写的那一整套菜单识别App,现在看来根本不该存在。软件3.0时代,很多我们习以为常的中间层、接口、逻辑,正被AI直接跨越。」

Andre观察到,这不仅仅是「编程加速」这么简单,而是信息处理方式的根本变革。AI不只是在帮你写代码,它在帮你“理解、重组、创造”新的数据结构——知识库、文档、图像,甚至策略计划。

3. 反常识洞察:不是所有工作都能被AI替代,但每个领域的“可验证性”决定了AI渗透的速度

Andre用「可验证性」来解释AI为什么在某些领域(比如编程、数学)进步飞快,而在另一些领域却总是磕磕绊绊。他发现,AI越容易对结果进行验证的任务,就越容易被迅速自动化。

「大型模型训练时,越能通过奖励机制‘验证’结果的任务,AI就越容易把能力快速拉满。比如象棋、编程、数学等领域,AI的进步异常迅猛。相反,像美学、判断力、创造力这些难以量化的领域,AI则会显得‘参差不齐’。」

他举例说,GPT-4能同时帮你重构十万行代码,查找零日漏洞,却可能在“我应该步行还是开车去50米外的洗车店”这种常识问题上犯低级错误。这种“智能参差不齐”的现象,他称之为「Jagged Intelligence」。

4. 未来图景:AI的“幽灵”本质与新型协作模式

Andre经常用“幽灵”与“动物”做对比。他认为,现在的AI更像是在数据和奖励函数里被“召唤”出来的幽灵,而不是拥有动机、好奇心和自我进化能力的动物。

「这些AI没有‘本能’,没有情绪。你吼它们,它们不会更努力。它们只是依据数据和统计规律做出反应。」

正因为如此,我们在与AI协作时,需要改变思维方式。过去的软件、文档和工具都是面向人设计的,现在则需要「Agent First」——一切工作流和数据结构,优先考虑如何让AI代理高效理解和执行。

他分享了一个亲身体验:开发菜单识别项目时,开发本身并不难,真正耗时的是各种部署、配置、第三方服务对接。「我多希望能直接给AI一句话‘帮我上线MenuGen’,一切自动完成。」

5. 人类的价值:理解、判断与品味,仍然不可替代

随着AI代理越来越智能,Andre发现自己在某些领域已经“被边缘化”了。比如底层API的参数、各种框架的细节,AI全都记得比他牢。但有三样东西,AI还远远做不到:

  • 理解全局:AI可以生成细节,但项目的整体方向、顶层设计、目标定义,依然需要人来把控。
  • 判断与品味:AI能写出“能用”的代码,但代码的优雅、可维护性、美学,依然有待人类工程师最后把关。
  • 真正的“理解”:如有一条金句所说——「你可以外包思考,但无法外包理解。」AI能帮你梳理信息、生成内容,但“为什么要做这件事”“如何选择最优路径”,依然需要你自己的认知去筛选和把关。

他坦言,自己最担忧的是「理解瓶颈」:信息爆炸,AI能生成无穷信息,但人脑的理解与吸收速度并没有变快。于是,如何用AI帮你构建知识库、协助你消化和升华这些信息,反而成了新的刚需。

6. 未来的协作场景:从“实习生AI”到“合伙人AI”

在Andre的设想中,未来每个人、每家企业都会有自己的AI代理。你的AI和我的AI直接沟通,自动协商会议、交换信息、自动完成任务。整个工作流将被重新设计,人与AI之间的“接口”将越来越模糊。

但他强调,这一切并不意味着人类可以“彻底甩手”。每当AI做错决策、出现诡异bug、在模糊地带游移时,人类依然需要站出来做最终的判断和定夺。

他举了一个“AI实习生”犯低级错误的例子:在MenuGen项目中,AI把两个不同邮箱(Google和Stripe)当作相同用户,导致用户充值无法到账。这个问题,只有具备业务场景理解和常识的人类才能看出症结所在。

7. 教育的终极命题:理解力,依然稀缺

在AI让“思考”外包变得越来越便宜的今天,什么还值得深学?

Andre给出的答案是:「你可以外包思考,但理解只能靠自己。」

他认为,真正值得深学的,是那些能帮助你建立世界模型、提升判断力、理解复杂系统运行原理的知识。AI可以辅助你整理、生成、推理,但最终的“为什么”——选择、评判、统筹的能力,只有靠你的理解力去夯实。

他把自己的知识管理方式概括为「用AI不断生成、重组、提炼信息,最终沉淀为属于自己的知识库」。每当他看到新的信息结构、新的投影方式,都会重新获得洞见。他坚信,未来的AI工具会越来越多地帮助人类提升理解力,而不是单纯替代劳动。

8. 留白:人类与AI的动态平衡

访谈最后,Andre轻描淡写地说:「也许几年后我们会再次坐在这里,看着AI是否已经连‘理解’都自动化了。」

但他话锋一转,眼神坚定——「至少现在,真正的理解,仍然是我们的独特价值。」

世界在变,AI在进化。唯一不变的,是人类对意义的追问,对未知的好奇,以及与AI共舞的勇气。