坚持两年每周手动上传视频的人,突然不干了。
Swix 在 Latent Space 社区的 AI in Action 分享会上,打开了自己的 Claude Cowork 界面。屏幕上,一个 AI 代理正在他的 Chrome 浏览器里,打开 Zoom 后台,点击「云录制」,下载共享屏幕视图,然后切换到 YouTube,逐个填写标题、描述、时间戳。
整个过程没有调用一行 YouTube API。
「我知道这听起来很蠢,」Swix 说,「但这就是我意识到 AGI 已经到来的时刻。」
会议室里 19 个人,有人在问技术细节,有人在质疑为什么不用 API。但 Swix 团队的 200 多名员工已经全员订阅了 Claude Cowork 的企业计划——每人每月 200 美元。
这不是演示。这是生产环境。
两年的手工劳动,浓缩成一句话
让我们看看 Swix 过去的工作流程。
每周五下午 3 点,AI in Action 的 Zoom 会议结束。然后他要做的事情包括:进入 Zoom 后台,找到最新录制,选择「共享屏幕+画廊视图」模式,下载 MP4 文件;切换到 YouTube Studio,上传视频,填写标题(需要根据内容判断是 Paper Club 还是 AI in Action),添加描述文字,设置发布时间,裁剪静音片段(因为有人会把会议窗口开着就走了),生成缩略图,最后点击发布。
「这些都是点击操作,」Swix 说,「我可以一边开会一边做,因为完全不需要动脑。但就是烦。」
烦到什么程度?两年来,他每周必做这件事。如果一周没做,下周就要处理 5 个视频积压。每个视频平均 15 分钟操作时间。累计下来,104 周 × 15 分钟 = 1560 分钟 = 26 小时。
一整天的工作时间,用来做机械点击。
然后他给 Claude Cowork 写了一段话:「请下载 Zoom 云录制中的最新视频,上传到 YouTube,根据内容生成标题和描述,裁剪掉静音片段。」
第一次运行时,Claude Cowork 确实出错了。它不知道该选择哪个录制文件,不知道如何判断视频主题,也不知道如何精确定位静音片段。但关键在于——Swix 可以实时看到它在做什么,可以在它卡住时帮它一把,可以在它完成后告诉它:「记住这个操作,写成一个 Skill。」
第二次运行时,Claude Cowork 调用了上次保存的 Skill。第三次,它主动询问:「需要我去 Zoom 设置里开启自动转录功能吗?这样我就能用转录内容来生成更准确的标题和描述。」
第四次,Swix 直接设置了定时任务:每周五下午 3 点,自动运行上传流程。
从此,他再也没有手动上传过视频。
为什么不用 API?这是个好问题
会议聊天区里,Kevin 提问:「为什么不用 YouTube API?」
这是每个工程师都会问的问题。调用 API 更快、更稳定、更便宜。用浏览器自动化去做 API 能做的事,就像用勺子挖隧道——理论上可行,但为什么要这么干?
Swix 的回答很直接:「我就是想看看 Claude Cowork 能做到什么程度。」
但真正的答案藏在后续对话里。
「你看,YouTube API 需要我去 Google Cloud Console 注册应用,创建 OAuth 凭证,设置回调 URL,然后写代码处理 token 刷新逻辑。」Swix 展开了一个浏览器标签页,「我他妈就是不想碰这些破仪表盘。」
屏幕上,Claude Cowork 正在自动执行他刚才补充的任务:去 Google Cloud 后台注册 YouTube Data API 密钥。它自己点击「创建项目」,自己填写表单,自己复制 API Key,然后把密钥存到本地 Skill 配置文件里。
整个过程 Swix 没有动手。
「所以你看,」他说,「不是 API 不好,而是 Claude Cowork 能让我完全不用学 Google Cloud 的那套鬼逻辑。它自己去搞定。」
这才是核心差异。
API 是为工程师设计的。它假设你懂文档、懂认证流程、懂错误处理。但 Claude Cowork 的浏览器自动化是为「我就是想把事情做完」的人设计的。它不需要你理解 OAuth2.0,它只需要你告诉它:「去帮我拿到 YouTube 的上传权限。」
更关键的是——它在你的浏览器里运行。你已经登录了 YouTube,已经登录了 Zoom,已经登录了所有需要的服务。Claude Cowork 不需要管理 token,不需要处理权限过期,因为它用的是你的会话。
「这就是为什么我说这是 AGI,」Swix 说,「因为它不是在优化工程师的工作流程,而是在优化普通人的工作流程。」
真正的 AGI,不是写出更优雅的代码。
是让不会写代码的人,也能自动化一切。
一个设计师,一夜之间部署了整个网站
会议进行到一半时,Swix 切换到另一个 Claude Cowork 对话窗口。
「这是我的设计师在用的,」他说,「这家伙在印度尼西亚,时差正好相反。我睡觉的时候,他在工作。」
屏幕上显示的是一个长达 97 条回复的对话线程。设计师发出一个 Figma 设计稿链接,Claude Cowork(这次用的是 Devon,但底层是同一套 MCP 协议)自动读取设计稿,生成对应的 React 组件代码,部署到 Vercel,然后把预览链接发回来。
设计师看了预览,说:「按钮的圆角不对。」Claude Cowork 改。
「动画需要慢一点。」改。
「这个颜色跟 Figma 里的不一样。」改。
整个对话从晚上 12 点持续到早上 9 点。Swix 醒来时,AI Engineer 大会的官网已经完全按照新设计重构完毕,并且部署上线了。
「我们从来没有在网站上投入过开发资源,」Swix 说,「因为我觉得会议的核心是现场体验和视频制作,网站好不好无所谓。但现在,维护一个精美网站的成本变成了零。所以设计师就开始做动画、做交互细节——那些我们以前永远不会碰的东西。」
这才是 Claude Cowork 真正改变的东西。
不是让现有工作变快。
是让以前「不值得做」的工作,变得值得做。
Skills:一种极慢的进化算法
回到 YouTube 上传的例子。
第一次运行时,Claude Cowork 需要 Swix 告诉它每一步该怎么做。第二次,Swix 告诉它:「把刚才的操作写成一个 Skill。」Claude Cowork 在本地文件夹里生成了一个 YAML 配置文件,记录了完整的操作流程。
第三次运行时,有人在聊天区建议:「能不能让它自动下载 Zoom 的转录文本,用转录内容来生成更准确的标题?」
Swix 直接在对话框里说:「更新你的 Skill,加入自动下载 Zoom 转录的步骤,并用转录内容来优化标题生成。」
Claude Cowork 去 Zoom 设置页面,找到「自动生成音频转录」选项,勾选,保存,然后更新本地 Skill 文件。
第四次,又有人建议:「封面图能不能也让 AI 生成?」Swix 说:「加进去。」
每一次反馈,都让这个 Skill 变得更完整。
「这就是记忆,」Swix 说,「一种非常慢的 Java。」
但正是这种「慢」,让 Claude Cowork 和其他 AI 代理拉开了差距。
OpenClaw、DevGPT、Bolt.new——这些工具都很强大,但它们都是「一次性执行者」。你给它一个任务,它完成,然后忘记。下次你再做类似的任务时,它又要从头推理一遍。
Claude Cowork 不一样。它会记住每一次你纠正它的方式,记住每一次你补充的细节,记住每一次你说「这样更好」的时刻。然后把这些记忆固化成 Skills,存储在你的本地文件夹里。
这些 Skills 不是通用的。它们是为你的工作流程定制的,是从你的真实需求中长出来的。
「第一次运行,你需要高强度监督,」Swix 说,「第二次,你给反馈,让它更新提示词。第三次,它就能自己跑了。这才是自动化的正确路径。」
而这个路径,API 做不到。
因为 API 是静态的。它只能做开发者定义好的操作。但真实世界里,每个人的工作流程都不一样。你需要的不是一个完美的 API,而是一个能学会你习惯的代理。
Claude Cowork 就是那个代理。
从 $200/月到 200 人全员订阅,发生了什么
会议最后,Swix 透露了一个数字:Latent Space 团队的 200 多名成员,全都订阅了 Claude Cowork 企业计划。
每人每月 200 美元。
「这不是演示工具,」他说,「这是生产环境。我们在用它处理 Zoom 设置、YouTube 上传、网站部署、表单填写——任何那种『你需要花 5 到 15 分钟在各种设置页面里点来点去』的任务。」
有人问:「非技术人员真的会用吗?」
Swix 的回答很简单:「你问问他们愿不愿意花 200 美元,换回每周 15 分钟被浪费在 Zoom 后台的时间。」
会议结束后,聊天区里有人说:「我刚订阅了。」另一个人说:「我在试着让它帮我填报销单。」还有人说:「我让它自动生成我们的周报,现在它已经能自己去 Jira 抓数据了。」
这不是技术爱好者的玩具。
这是白领工作者的生产力革命。
而这场革命的核心,不是更快的 API、更强的模型、更复杂的 Agent 架构。
是一个简单到反直觉的设计:让 AI 在你的浏览器里,用你的账号,做你会做的事。
然后记住。
然后越做越好。
尾声:AGI 的定义,终于可以更新了
Swix 在会议最后说了一句话:「我们就不断重新定义 AGI,直到我们拥有它为止。」
有人笑了,说这是 Anthropic 做基准测试的方式——不断调整测试标准,直到 Claude 通过为止。
但 Swix 认真了:「不,这次不一样。因为 Claude Cowork 通过的不是基准测试,而是真实世界的生产环境。200 多个人在用它干活,而不是在实验室里测评它。」
AGI 不是在 SWE-bench 上拿高分。
AGI 是一个不懂代码的设计师,能在一夜之间部署网站。
AGI 是一个讨厌 Google Cloud 后台的创业者,能让 AI 代他去搞定 API 注册。
AGI 是一个被 Zoom 设置页面折磨了两年的社区运营者,能在周五下午 3 点准时下班,因为视频会自己上传。
「如果你需要证据,」Swix 说,「就去订阅一个月。然后给自己定一个规矩:每天必须让 Claude Cowork 做一件事。你会惊讶于结果。」
会议录制结束后,这段视频会自动上传到 YouTube。
标题、描述、缩略图,都会由 Claude Cowork 生成。
Swix 不需要动手。
因为 AGI,已经在干活了。
