Google Labs五款AI冷门神器实测:蛋挞太大,幻灯片自动画,柯基与哈士奇的相遇
AI Products

Google Labs五款AI冷门神器实测:蛋挞太大,幻灯片自动画,柯基与哈士奇的相遇

无 | 主持人: Peter Yang
2026年4月29日YouTube
返回首页

金句精选

AI能生成90%的内容,剩下的10%却最难。

蛋挞可以无限放大,但品牌细节AI还学不来。

热力图能预判用户点击,却无法传递创意的温度。

3D世界能自动生成,游戏乐趣AI还未掌握。

从设计到代码一站直达,是Google AI必须补齐的缺口。

一张蛋挞图,把整个测试现场逗乐了。用Google Pomelo生成的亚洲妈妈吃蛋挞的场面,蛋挞尺寸堪比脸盆。AI的精准度显然还在成长,但Google Labs这些鲜为人知的AI工具,远不止于一块蛋挞的误差。隐藏在Gemini和主流应用背后的,是一套接一套的新玩法,这些工具到底能做什么,又藏着多少有趣的细节?

有些答案,在实验室里等你。

Pomelo:品牌DNA自动提取,20秒出营销图,但蛋挞太大了

想象有一天,你只需要贴个网站地址,AI就能识别品牌的主色、字体、Logo,甚至连产品摄影风格都能抓个八九不离十。Pomelo就是这样一个营销素材生成器。Peter Yang选择了亚洲烘焙店Simply Cake作为样本,AI一眼认出了品牌视觉,用二十秒生成了一套母亲节主题的营销活动——标题是「给妈妈一片云」,配图是家庭聚会、轻盈蛋糕和亚洲妈妈的温馨场景。

但新鲜感还没散去,AI生成的一张「亚洲妈妈吃蛋挞」的场景图,突然让人出戏。蛋挞大到仿佛主角,妈妈则显得有点无所适从。Peter忍不住笑了——AI画画,真的还没见过太多蛋挞。

Pomelo试图解决电商和实体品牌的内容短缺问题,尤其适合拥有大量产品图的用户。一键生成各种社交媒体活动、节日海报、场景化摄影,省下不少脑细胞。可一旦涉及到内容型品牌,或者产品照片有限,Pomelo就有点力不从心。更现实的难题是,每次你想改动文案或小图标,都只能重新生成整张图片,不能直接在图片上编辑。这种反复试错的体验,令人抓狂。

Pomelo很聪明,但还不够体贴。有时候,蛋挞会变大。

Stitch:Google版Figma,设计师的快手,但用户输入太简陋

Figma撑起了无数初创项目的第一张App原型。Google Labs的Stitch则想给Figma添点AI魔法——输入一句「设计一款手机健身App」,AI不到三十秒就给你全套设计系统,还有四个App页面,所有组件和色彩风格一目了然。速度比Figma插件快得多,因为底层用的是Gemini Flash。

Stitch的一大特色,是会自动生成预测热力图。你能在界面上看到那些「用户最可能点击」的区域,热区用渐变色标记,仿佛提前预知了用户的手指走向。

然而,体验到这里,转折出现了。Stitch的「一把梭」策略省事,但也让人无力。Peter对比了Claude Design——后者会主动追问你一连串问题:需要哪种风格、设计哪些界面、偏好哪类设备框架。Claude Design不怕啰嗦,反而让你脑海里起草的细节一步步落地。而Stitch,只能靠一句简单的prompt完成全部设定。大多数用户根本写不出那么详细的prompt,效果时好时坏。

如果Stitch能直接整合进Google的AI Studio和Antigravity平台,成为设计到代码的一站式入口,Google在编程AI领域的竞争力才算真正补齐。但现在,这一环还缺着。

Project Genie:30秒生成3D赛博世界,视觉酷炫但离游戏还有距离

Project Genie给人的第一印象,就像科幻片里的快速世界生成器。输入一句prompt,比如「建一个霓虹赛博朋克城市,有人群、穿透明夹克的女孩和盘旋的无人机」,等待30秒——屏幕上出现了五光十色的都市,建筑、人物、无人机呼啸而过,主角还能用键盘自由行走。

视觉的震撼扑面而来。空中闪烁的灯管、街角聊天的人群,仿佛真能拉你入戏。但仔细一看,这个AI生成的3D世界,其实只是个漂亮的技术演示。它用的是逐帧生成,每次刷新世界都像在画一幅新的油画。交互虽然自由,但缺乏真正的「游戏性」。

人工智能真的能革命游戏行业吗?Peter并不买账。他认为,优秀游戏的精髓从不是画面多酷炫,而是那些微妙的循环机制、成长路径、玩家间的互动关系。这些,AI还远远没有解决。即使AI能画出千变万化的霓虹城市,真正的游戏体验却还在遥远的前方。

Flow:柯基与哈士奇的相遇,AI做出了「流畅」的视频

Flow是Google Labs里最出色的动态图像生成器,集成了Imagen、Gemini和Veo三大模型。Peter用它测试了「帧控制」功能——先生成两张静态画面:起始帧,一只柯基走在日本街头;结束帧,柯基遇到哈士奇。然后,他让Flow自动补全中间的过渡视频。

没想到,视频生成的过程如此顺滑——柯基从街道上一路踱步,镜头推进,最后与哈士奇鼻尖相对。画面带有音效和背景音乐,气氛温馨自然。就像动画导演在AI的协助下完成了故事板。

但Flow也有短板。两个场景差异太大时,比如「潜水员变身亚特兰蒂斯」,AI就会直接硬切画面,过渡毫无章法。更遗憾的是,这些强悍的功能,目前还没有整合进主Gemini App。用户只能在专属界面小众体验,离全面普及还差一层窗户纸。

有些细节令人心痒,却还没真正到来。

NotebookLM:自动整理、汇总、思维导图全自动,但手动编辑成奢望

与前几款AI工具不同,NotebookLM是唯一已进入Gemini主App的Google Labs产品。Peter直接把本期视频字幕上传,AI瞬间自动生成了简报、信息图、思维导图和幻灯片。最有意思的,是AI自动画出一张「AI能完成90%的任务,最后10%必须手动打磨」的图表。图中的分界线清晰直观,仿佛提醒每个内容创作者:AI永远无法替你画龙点睛。

NotebookLM还会生成音频概览——一对播客主持人围绕核心话题对话,用户随时可以插话提问。对于习惯碎片化获取信息的人来说,这种「对话式摘要」格外贴心。

然而,问题随之而来。很多用户希望能手动编辑AI生成的文案、图表或者套用自己的设计模板,可NotebookLM只能通过prompt让AI重新生成一版。你想改动个颜色、调整个标题,都得折腾大半天。这种「AI90%,用户10%」的理念,如果缺乏灵活的手动编辑,把创意的最后一公里变成了反复摸索的死胡同。

如果NotebookLM能和Google Slides、Docs无缝互通,或许内容生产者们会更省心。

Google AI的步伐:慢、缺口、细节

Google Labs的产品,各有光芒,也各有烦恼。Peter总结了三个关键问题:

第一,Labs里的创新太慢进入主Gemini App。NotebookLM都花了半年才合并,而Anthropic的Claude几乎天天上新。创新快慢,影响用户粘性。

第二,Stitch应该成为AI Studio和Antigravity的「前门」,即先可视化设计,再一键生成全栈代码。现在Google在编程AI领域还被Codex和Claude Code甩在后头。这一环必须补齐,才能给开发者更高效的体验。

第三,所有AI产品都要支持手动编辑。AI能搞定90%,但用户只想改个小标题或图片细节,却要一遍遍重写prompt,令人抓狂。

Google AI的实验室很大,想法很多。但到了真正落地时,每一步都还藏着不小的门槛。未来,或许蛋挞的尺寸会变得恰到好处,柯基与哈士奇的相遇也会更自然。可在那之前,AI和人的距离,还需要一场场测试去拉近。

测试结束,Peter关上了电脑。窗外的天色渐暗,他忽然想起那个蛋挞妈妈的画面——如果下一次,AI能画对蛋挞的大小,会不会就能画对我们的生活细节?

有些答案,仍在等待中。


关键金句

金句1:AI能生成90%的内容,剩下的10%却最难。 金句2:蛋挞可以无限放大,但品牌细节AI还学不来。 金句3:热力图能预判用户点击,却无法传递创意的温度。 金句4:3D世界能自动生成,游戏乐趣AI还未掌握。 金句5:从设计到代码一站直达,是Google AI必须补齐的缺口。