Google AI Studio产品负责人揭秘:68秒从想法到产品的极速开发哲学
AI ProductsAI Organization

Google AI Studio产品负责人揭秘:68秒从想法到产品的极速开发哲学

L
Logan Kilpatrick (Google AI Studio Product Lead)
2026年1月25日YouTube
返回首页

金句精选

我们用AI Studio来构建AI Studio。

只有一种模式,就是快速发布。没有其他选项。

预测未来最好的方式,就是去构建它。

我们不再需要PRD和设计稿了,直接构建。

68秒,从一张图片到完整可用的功能界面。

Logan截了一张AI Studio界面的图,丢进AI Studio,打了一句话:「完全克隆这个UI,用一模一样的样式。」68秒后,一个可交互的、功能完整的AI Studio复刻版出现在屏幕上。

然后他继续对着这个复刻版说:「给我5到6种不同的设计风格,在UI里加一个控件让我能点击切换。」又过了一会儿,界面上多了一个切换按钮,粉色版、野兽派版、极简版AI Studio依次出现。

这不是在做demo。这是Google AI Studio团队每天的工作方式。他们用AI Studio来开发AI Studio,「一天几十上百次地克隆界面、加功能、迭代」。

如果你还在先写PRD、等设计稿、再开发原型,你可能正在用「瀑布时代」的流程工作——而有些团队已经把原型本身变成了决策工具。


Logan是Google AI Studio的产品负责人,一个曾经是专业软件工程师、但现在「不怎么手写代码了」的PM。

AI Studio最早是Google给开发者用的模型playground:你可以在这里试用Gemini API的最新模型,调试prompt,管理配额和账单。但2024年后,它变成了一个「Vibe Coding平台」——你输入想法,它直接给你生成可运行的App。

Logan展示的第一个功能叫「I'm feeling lucky」(手气不错)。点一下,AI会随机生成一个产品创意,比如「跨平台社交媒体内容生成器」。你点「开始」,它就自动开始搭建。

整个过程不需要写一行代码。你可以在左侧聊天栏继续提需求,可以看到它生成的所有文件(constants.ts、app.tsx),可以预览运行效果,也可以打开代码手动改——但你完全可以不看代码就完成整个产品。

「如果你的朋友用AI Studio做了个App,他可以直接把链接发给你,」Logan说,「你可以Fork它、Remix它、加你自己的想法。」

这不是一个封闭的在线IDE。它是一个可以分享、可以协作、可以多人同时迭代的开发环境。10个人开会时,可以从同一个原型出发,各自Fork出10个变体,每个人加不同的功能。

而且它是免费的——至少基础功能免费,除非你要用Nano Banana Pro这种需要付费API的模型。


Logan演示了一个更实际的场景:用AI Studio开发AI Studio。

他打开AI Studio界面,按下截图,然后新建一个项目,输入:「Clone this UI exactly, use the same styles.」(完全克隆这个UI,用同样的样式。)

68秒后,一个几乎一模一样的AI Studio界面出现了。侧边栏、顶部导航、按钮样式、字体大小,都被复制过来了。

「我们团队就是这么干的,」Logan说,「我每天都在克隆AI Studio的UI,然后让它加功能、改细节。我们一天要做几十上百次这种操作。」

这不是炫技。这是一种新的产品开发流程。

传统流程是:PM写PRD → 设计师出设计稿 → 工程师开发原型 → 开会讨论 → 修改 → 再开发。这个循环可能要几天到几周。

新流程是:截图 → AI生成原型 → 直接在原型上迭代。从想法到可交互的产品,68秒。

「以前我们得先写PRD、做设计,」Logan说,「现在我们要求PM必须做一个功能性原型,这是流程的一部分。」

但关键问题是:他们还写PRD吗?

「我们现在三样都做,」Logan说,「PM还在写PRD,设计师还在做设计,但我们同时也要求你必须做一个可运行的原型。」

这听起来像是增加了工作量,但实际逻辑是:原型不再是「验证想法的工具」,而是「表达想法的语言」。当你能在68秒内做出一个可点击的原型,原型就变成了PRD的可视化版本。

Logan演示了如何在原型上快速迭代设计方案。他对着刚才克隆的界面说:「我很喜欢现在这个版本,但我想看5到6种不同的设计风格。给每种风格做一个版本,然后在UI里加一个控件,让我能点击按钮切换这些风格,不用刷新页面。」

他说这段话的时候没有打字,而是用语音——AI Studio有「Yap to App」(从说话到应用)功能,你可以直接对着麦克风讲需求。

「我总是得用很啰嗦的方式说,」Logan笑着说,「我不知道怎么简洁地表达这个需求,但这是我的常见工作流:我想在UI里加一个按钮,点一下就能看到5到6个不同的UI方案。」

几分钟后,界面右上角多了一个样式切换器。他点了一下,出现了粉色版AI Studio。再点一下,出现了「Brutalism」(野兽派)风格版本——深色背景、粗字体、强对比。

「这个其实看起来还不错,」Logan评价道,「我通常更多是用这个功能来试不同的功能设计,而不是样式,但它对样式也确实有帮助。」

这个场景揭示了一个反直觉的现象:当你能快速生成多个方案,设计决策就不再是「选对的那个」,而是「排除不对的那些」。你不需要在脑子里想象5种方案的样子,你直接看到它们,然后做判断。


但最有意思的部分不是生成,而是修改。

AI Studio有一个叫「Annotate」(标注)的功能。Logan打开标注模式,在刚才的界面上圈出「Recently Viewed」(最近查看)这个区域,写了一句话:「我真的很讨厌这个区域,能让它默认折叠吗?」

然后他点「Add to chat」(加到聊天),AI自动把这个带标注的截图发送给模型,prompt是「应用截图中显示的编辑」。

几秒后,界面刷新,那个区域变成了一个可折叠的模块,默认是折叠状态。

「这就是多模态的威力,」Logan说,「我们在开发AI Studio的时候,核心思路就是:什么地方可以「赌在模型上」(bet on the model)。这就是一个典型例子——你可以用传统方法实现这个功能,但多模态理解已经足够好了,你为什么不直接用截图+标注?」

他提到Gemini 3 Pro在几乎所有多模态benchmark上都达到了state-of-the-art(最先进水平)。「你在这些例子里能真正感受到这一点,」他说。

这个标注功能的意义不在于它省了多少打字时间,而在于它改变了「描述需求」的方式。以前你得用语言描述「把左上角第二个模块的默认状态改成折叠」,现在你直接圈出来,写一句话就行。

语言是线性的,截图是空间的。当你能用空间方式表达需求,很多原本难以描述的东西变得简单了。


Logan还演示了一个更复杂的例子:从平面图生成3D可视化。

他上传了一张AI生成的房屋平面图,输入需求:「我有这张平面图,我想做一个App,可以上传平面图,然后把它变成可交互的3D模型。可以用Three.js来做3D可视化,也可以用其他方式,你给我一些不同的方案,加一些功能,做完告诉我。」

他说完这段话,切到另一个标签页,继续演示别的功能。过了几分钟,回来一看,App已经生成了。

界面分成左右两栏:左边是上传的平面图,右边是一个3D模型。他点击「3D Schematic」(3D示意图)标签,出现了一个可旋转的3D房屋模型,厨房、卧室、车库、浴室的位置都对上了。

再点「Remix」标签,可以用Nano Banana Pro重新生成平面图的视觉风格。他输入「modern minimalist」(现代极简风),几秒后,平面图变成了一种带动画效果的极简风格图。

「每次做这些我都觉得,我应该全职去做创业公司,」Logan说,「因为这已经是50%的人真正想要的产品了。你离一个能用的产品已经非常近了。」

这不是夸张。很多SaaS产品的核心功能其实就是「上传X,生成Y,提供几个调整选项」。如果AI能在3分钟内做出一个80%完成度的版本,剩下的20%可能只是加一些细节、优化性能、连接支付系统。

Logan说他经常看到人们在AI Studio的App Gallery里发布各种应用:从漫画生成器、游戏、体素艺术工具,到天气可视化、产品mockup合成器、SVG艺术生成器。「有些真的很搞笑,比如球弹跳模拟器,」他说,「但关键是你可以Fork任何一个,然后改成你想要的东西。」

他当场Fork了那个球弹跳模拟器,对它说:「不要球了,改成水滴,要有流体动力学效果。」

结果是半成功的:球变多了,看起来更像是「每个球是一滴水」,而不是真正的流体模拟。但重点不是它完美实现了需求,而是你可以在30秒内尝试这个想法,看看效果如何。


想想你上次去餐厅点菜。

如果菜单上只有文字描述,你得想象「糖醋排骨」是什么样子。但如果菜单上有照片,你直接看图,然后决定要不要点。照片不是为了展示厨师的手艺,而是为了降低你的决策成本。

原型的作用正在从「验证技术可行性」变成「降低决策成本」。

Logan说他们团队现在的产品评审流程是:「有时候会有人准备幻灯片,讲一些背景信息,然后我们会看demo。但几乎每次我们都在看可交互的live demo,团队可以直接在上面操作。最有意思的是,开会的10个人可以从同一个原型出发,各自迭代,加不同的功能。」

这和传统的「评审会」完全不同。传统评审是PM讲、设计师展示、工程师评估可行性,最后大家投票或者由领导拍板。新模式是:大家一起玩这个原型,每个人Fork一个版本,10分钟后你能看到10个不同的演进方向。

决策不再是「选A还是选B」,而是「看这10个方向里,哪几个值得继续做下去」。

Logan还提到,他们正在开发一个功能,让用户可以导入自己的style guide(设计规范),这样AI生成的界面就能自动符合你的品牌风格。「我们也在想怎么让更多Google服务能这样开箱即用,」他说,「现在Google Search和Google Maps已经集成好了,你不需要单独设置API,直接就能用。」

这一点很关键。很多Vibe Coding工具的最大痛点不是AI能力,而是「配置环境」——你得申请API key,配置OAuth,设置环境变量。如果这些都能开箱即用,门槛会降低一个数量级。


但这种方式不适合所有场景。

Logan强调,他们团队仍然写PRD,设计师仍然做设计。「只是现在多了一个要求:你必须同时做一个功能性原型。」

为什么还要写PRD?因为原型解决不了「为什么要做这个功能」的问题。原型只能回答「这个功能长什么样」「用起来感觉如何」,但不能回答「这个功能的商业价值是什么」「它解决了用户的什么痛点」。

PRD是给团队看的,原型是给决策者看的。你需要两者。

另一个限制是:这种方法只对「界面驱动的产品」有效。如果你在做一个需要复杂算法、高性能计算、或者深度系统集成的产品,AI生成的代码可能只是一个框架,真正的难点在AI看不到的地方。

Logan也承认设计师的作用没有被取代。「我们的设计师Amar非常有才华,」他说,「我的限制是,我不知道怎么指导模型去做他们做的那些细节。我根本想不到那种设计方式。限制不是工具,而是如果你有那种知识,你才能真正驾驭这些工具。」

这就像Photoshop不会让摄影师失业一样——工具降低了执行成本,但没有降低审美门槛。你仍然需要知道什么是好设计,才能用AI做出好设计。

最后一个限制是速度文化。

Logan说他们团队「只有一种模式,那就是快速发布,没有其他选项,没有其他替代方案」。但他也承认,这需要「正确的支持结构」。Josh(他的老板)给了团队很大的自主权,Demis(DeepMind CEO)和Sundar(Google CEO)从上层推动了「紧迫感」文化。

「我甚至不知道如果不快速行动,怎么做这件事,」Logan说,「我不会每天早上醒来想'啊我们今天得快点发布'。这不是一种心态,这就是唯一的路径。」

但这种文化不是所有公司都有。如果你的公司还在做两年规划、季度OKR、跨部门审批,你很难用这种方式工作。


Logan在演示结束时说了一句话:「我觉得我应该全职去做创业公司,因为这(指AI生成的App)已经是50%的人想要的东西了。」

但他没做。他还在Google,还在做AI Studio。

不是因为他不相信这些AI生成的App能成为真正的产品,而是因为他知道「从50%到100%的那段路」仍然需要人。需要理解用户痛点的PM,需要能做出微妙细节的设计师,需要能优化性能、处理边界情况的工程师。

AI让你能在68秒内做出一个能用的原型。但从「能用」到「好用」,从「好用」到「有人愿意付费用」,这段路仍然需要人类的判断、品味、和耐心。

只是现在,你可以用68秒来测试10个想法,而不是用两周来验证一个想法。

这可能才是真正的变化。