Notion联创的极致实验:我让AI连续运行13天完成工作
AI OrganizationAI Products

Notion联创的极致实验:我让AI连续运行13天完成工作

S
Simon Last (Notion联合创始人) | 主持人: Sarah Guo & Elad Gil
2026年3月12日YouTube
返回首页

金句精选

「我已经不再写代码了,去年夏天之后就再也没亲手写过。现在我完全是一个Agent管理者。」

「你可以成为一个100倍、甚至1000倍的工程师,只要你善用这些工具。最低标准没变,但天花板被彻底抬高了。」

「每天晚上睡觉前,我要确保给Agent足够的任务,保证早上醒来时它还没完成。这就是胜利。」

「我们每六个月就重写一次AI框架。你必须时刻意识到当前模型和技术的状态,围绕它深度设计产品和系统。」

「我们的用户研究对象变成了Agent本身——它随时在线,可以无限次对话,还能脚本化扩展访问规模。」

去年夏天之后,Simon Last就再也没有亲手写过一行代码。

这位Notion联合创始人现在每晚睡前做的最后一件事,不是检查邮件或复盘工作,而是确认一件事:他给AI Agent分配的任务,是否足够撑到第二天早上。

「我的个人记录是让一个编码Agent连续运行13天,中间没停过。」他说这话时,语气就像在分享一个游戏通关纪录,「每天晚上我都要确保给它足够的任务量,保证早上醒来时它还没完成。这就是胜利。」

这不是炫技。

这是Notion正在经历的一场根本性转变——从「为人类打造最好的工具」到「为人类管理Agent打造最好的平台」。

2022年的墨西哥时刻

转折点发生在2022年,Notion公司团建去墨西哥的那次offsite。

Simon和联合创始人Ivan同时拿到了GPT-4的早期访问权限。那是一个类似ChatGPT的原型界面。两个人试用了不到一个小时,就立刻达成共识:时代变了。

「两件事让我们震惊,」Simon回忆,「第一是它真的很聪明,能理解相当复杂的指令,能帮你写东西、改东西。第二是它的知识范围——既深又广的世界知识。」

他们当场制定了双轨策略:

短期:做一个写作助手,能在文档里选中文字、重写、查资料、给出引用。这个方向在三个月后就上线了,成为2023年2月发布的Notion AI Writer。

长期:做一个通用助手,给它Notion里所有人类能用的工具——创建数据库、查询、操作、编辑文档,让它能完成长链路任务。

但长期愿景卡住了。

「我们其实试了三四次,」Simon坦承,「每次都能跑起来,但就是不好用。」直到2025年8月,他们才真正发布了可用的个人Agent。

这段漫长的等待,最终凝练成了一个核心方法论:每六个月重写一次AI框架。

重写不是妥协,是必修课

「这是很多公司搞错的地方,」Simon语气坚定,「他们做了一个系统,然后就一直用下去。但你必须时刻意识到当前模型和技术的状态是什么,然后围绕它深度设计你的系统和产品。这基本上意味着——每六个月就得重写。」

重写的速度还在加快。因为进步在加速。

他们即将在一两周内发布新版框架。而下一版的规划已经在进行中。

这听起来像是巨大的工程负担,但Simon说:「我觉得挺好的。这是流程的一部分,你得重启、重新思考。」

转机出现在2024年4月。Simon开始使用Claude Code。

「那是个巨大的解锁时刻。」

在此之前,他们经历过Tab自动补全时代,也试过插入、重写代码片段,但都不够彻底。直到Agent真正能端到端地实现、验证、维护代码,一切才改变。

「关键在于,你要非常认真地思考架构和验证循环。做得好,你能比人类手写代码更大胆、更稳健。做得差,就全是垃圾。」

从100倍到1000倍工程师

这对团队结构的影响,超出了大多数人的想象。

「我不认为团队规模受到多大影响,」Simon说,「我们一直喜欢小的精干团队。这点没变,可能还更极端了点。」

但个体产出的天花板,被彻底炸开了。

「你现在可以成为100倍、甚至1000倍的工程师。」他停顿了一下,「最低标准没变,但最高标准被极大地提升了。差距变得更大。」

整个Notion内部的工作状态,也变得「有点混乱」。

设计团队搞了个叫Design Playground的独立代码仓库,用简化版的Notion + 一堆UI组件库,让设计师能快速生成超高保真度的原型。不再是指着Figma说「大概是这样」,而是直接给你一个可部署的URL。

工程团队的每个PR都变得更大、更复杂。

「这是最糟的部分,」Simon笑着承认,「但好的部分是,它们的测试也变得更完善。我现在绝不会提交一个没有经过端到端测试的PR。你可以达到很高的置信度——但前提是,你不是在瞎聊需求,而是认真思考『我要做什么改动、如何验证、如何安全部署』,然后让Agent帮你完成整个流程。」

代码审查依然存在。但审查的是Agent写的代码。

Agent也是用户

Notion的AI产品线演进,本身就是一部「与Agent共同进化」的编年史。

2023年2月:AI Writer上线,单步任务,重写、编辑,不涉及检索,直接调用模型。

2023年10月:Q&A上线,对整个工作空间做语义索引,回答问题时给出来源。

然后是更大的野心:索引所有第三方数据源——Slack、Google Drive,以固定节奏上新。

「说实话,这些产品本身都没完全解决好这些问题,」Simon直言不讳,「但我们发现,大多数公司在做索引这件事上都挺糟的。这让我们有点困惑。」

他总结出两个关键:AI工程的精明度 + 工艺和细节。

「你得非常经验主义、迭代驱动——每天真的去试各种查询。每个数据源都不一样,Slack和Google Drive是完全不同的信息类型。你得投入工艺和爱,不断尝试、调整检索逻辑。」

但更有趣的转变是:Notion把Agent当成了一类新用户。

「我们过去有两类用户:人类,和用API的人类程序员。现在有了第三类:Agent。」

一开始这是个问题。Notion的API用的是「对人类和模型都很痛苦」的JSON格式来表示blocks。

「所以我们把它变成了工程挑战,专门为Agent设计了超级友好的API。」

具体做法:用一种增强版的Markdown方言来读写页面,看起来像普通Markdown,但支持所有Notion的block类型。模型对它的表现非常好。数据库则用SQLite语法,Agent直接用SQL操作。

「怎么知道什么对Agent友好?」Simon说,「很经验主义。你不断试,发现『哦,这个它不行』『这个token太多了,怎么压缩』。再加一点第一性原理思考——模型是在什么数据上训练的?它的先验知识是什么?它天然擅长什么?Agent loop怎么运作?什么样的访问模式对它来说最方便高效?然后就是大量实验。」

有一次播客录到一半,Simon突然说得去给设备充电,因为不能让Agent停下来。

「我现在有几个Agent在跑一个新原型,」他展示自己的工作流,「工具就是Claude Code或Codex,我比较喜欢CLI工具,简单好用。我的整个目标就是:让尽可能多的Agent一直跑着。」

邮件清零的秘密

Notion内部已经有大量自定义Agent在运行。

Simon最爱的是他的邮件分拣Agent。

它有权限访问Simon所有的工作和个人邮件,每天自动醒来,把不需要看的全部归档。

「训练其实挺简单,」Simon说,「你给它创建Agent,授予邮件权限,再给它一个空白页面当『记忆』,让它能编辑那个页面。然后你就说:去看我的邮件,采访我,问我哪些该归档。」

Agent会提出建议,Simon纠正它,它就把这些反馈写成规则列表。

「前几天我一直在纠正它。几周之后,我完全取消了审批环节。它现在就自己归档所有我不需要看的东西。」

他的邮箱95%都是不需要看的。现在收件箱只剩真正重要的。

另一个Agent负责分拣内部反馈和Bug。

Notion有个Slack频道,员工随手扔产品反馈和Bug,过去是「有人回应,也有人被忽略,取决于哪个团队在看」。

这个Agent的唯一工作:路由到正确的地方。

它也用类似的记忆模式,自己学习了几百条路由规则。比如移动端的Bug就路由给移动团队,在他们的数据库里创建任务。

「一开始我会看它生成的记忆,」Simon说,「但一旦你信任它能正常工作,你就不看了。偶尔它坏了,我再去修。」

从编码者到管理者

「我现在完全是一个Agent管理者。」

Simon的工作流已经彻底改变:不再是「人类打字写代码 → tab补全 → Agent帮我写小任务」,而是「设计一个端到端任务,包括实现和验证,然后我是最外层的验证者,偶尔监控一下别跑偏」。

Notion也在帮非技术团队跨越这个鸿沟。

一个月前,Simon给人事团队做了场Hackathon。「人事团队是最高采用者之一。他们有大量Slack和Notion之间的手动工作流,非常适合自动化。」

他发现,最大的障碍其实不是技术,而是「让人们相信它能工作」。

「一旦他们跨过『什么是prompt』『Agent怎么被唤醒』这些概念门槛,接口其实挺人性化的。」

Notion的长期愿景也在变得更激进:让Agent能从一个初始内核,自己引导出任何能力。

「比如,如果某个集成我们还不支持,它能自己写一个、部署、然后用起来。」

Simon认为编码Agent是AGI的内核。「AGI会是一个编码Agent。代码是表达确定性逻辑的超级有用的原语。把它应用到知识工作Agent上,真正激动人心的是——它能自我引导能力。如果集成不存在,它能造一个。如果需要连接新数据源,它能做到。」

工具还是平台?

Notion的处境有点微妙。

它是个有规模的产品,但身处的是规模更大的玩家主导的战场——微软、Google、各大实验室,都在做Agent,都在尝试跨平台集成和索引。

Simon的策略是:做模型的瑞士。

「我们和客户都不想被锁定在某个实验室的模型上。每个月排名都在变,这个月这家好,下个月那家好。我们想成为一个地方——你能轻松访问所有最好的模型,随时切换。」

这包括开源模型。「现在有四个中国模型都挺好,我们上周刚加了一个,会把四个都加进去。它们真的不错,而且比前沿模型便宜太多。」

Notion给自己的定位是:拿到所有最好的模型,做出真正高质量、先进的Agent实现,让人们能方便地用上,然后提供一个「真正适合人类和Agent协作」的工作空间。

「这是世界需要的,」Simon说,「我们只是在尝试以一种有品味、执行良好的方式去做。」

他们也在为Agent重新设计Notion的底层结构。

Blocks和数据库对Agent依然有用,但现在有了新要求:对Agent友好。「过去是对人类友好,然后我们做了API给写代码的人类用。现在我们有了新客户——Agent本身。」

采访结束时,主持人问:过去六个月,你个人工作方式最大的变化是什么?

Simon想了想:「完全变了。我去年夏天之后就没写过代码。我不再打字写代码了。这是彻底的转变——从人类打字,到tab补全,到Agent帮我做小任务但我还在外层循环,到现在我只是Agent管理者。」

他顿了顿,笑着补充:「不过每晚我还是会醒来几次,看看它们是不是还在跑。」