创作说明: 本篇文章根据Encord创始人Ulrich与Eric的访谈改写,聚焦「物理AI是数据驱动」的反直觉洞察。通过投资人轶事、折叠衣物机器人案例和数据飞轮细节,还原AI基础设施世界观。
在伦敦的一个冬夜,一位硅谷投资人坐在Soho区的酒吧角落。他正听完Ulrich和Eric的创业故事:要做AI数据基础设施,让机器人更聪明。结果,他皱着眉头,摇头说:「AI市场不够大」。说完,他掏出手机,回了一封邮件,下一秒投给了冰岛的一款约会应用。
没想到几年后,这个当初被拒绝的Encord,成了全球机器人公司争抢的底座。那位投资人,偶尔在朋友圈自嘲:「人类的浪漫总比机器的未来更诱人」。
两个人如何看到别人没看到的趋势
2021年,硅谷还沉浸在加密货币的狂欢和远程办公的想象中。ChatGPT还没出来,大部分人对AI的理解,还停留在写诗、画画和金融预测。那一年,Ulrich刚从帝国理工毕业,带着一身深度学习的本事,却没有投身热门的金融科技赛道。他和Eric——那位曾在高频交易公司做极限代码优化的年轻人——凑在一起,盯着另一个角落:机器人。
「全世界80%的经济,其实都是在动手:搬货、洗衣、开车、巡检。」Eric在湾区考察时,看到一间间自动化实验室,里面是折叠衣服的机械臂、自动分拣的无人车、在工厂里穿梭的仿生机器人。他们发现,这些机器人公司都在头疼一件事:模型总是「出神」,现实世界的数据太脏,标注太慢,训练一次得等好几天。
他们开始跑YC的冬季批次。那时候没人觉得AI基础设施能做大。Ulrich记得很清楚,「那年最火的是金融科技和加密货币。我们说要做AI数据平台,大家一脸困惑。」
但他们脑海里有条清晰的线索:「数字AI的黄金年代靠的是算力,未来的物理AI,拼的却是世界里的数据。」
物理AI的核心矛盾:「有芯片,没脏衣服」
Ulrich有一句话,后来在Encord的All Hands上被反复引用:「With physical AI, it's actually the opposite. Now we have all the compute infrastructure, but you need the data to actually get to the scaling law.」
这句话听起来拗口,背后却是一场技术世界的翻转。
在过去十年,AI的主战场是互联网。文本、图片、视频、社交网络数据,全都在云端。不管是写代码还是作画,算力决定上限。只要有NVIDIA的GPU堆起来,多大模型都能训出来。
然而机器人世界完全不同。你可以花几百万买下最强的芯片,却找不到足够多的「脏衣服」来训练折叠算法。自动驾驶的公司,必须让车在各种雨雪天、拥堵路、突发事故里跑成千上万公里,才能采集到一组能用的真实数据。
「A model is only as good as the data it's trained on, and even the slightest errors in the dataset can influence and impact how the model actually works in the real world.」Ulrich说。
这句话听起来简单,但现实是残酷的。哪怕数据里有0.1%的标注错位,机器人在工厂里分拣的时候,就可能夹断一只手指。在自动驾驶场景,模型一旦「hallucinate」——也就是出现幻觉——后果不再是虚拟世界的笑料,而是无人机从天上掉下来,或者汽车直接撞上路边。
ChatGPT问你「你几点下班」答错了,不过是个段子。但仓库里的机器人认错了货物,损失就是真金白银。
数据的稀缺、标注的昂贵、场景的复杂,让物理AI的「飞轮」迟迟转不起来。算力还在进步,数据却成了瓶颈。Eric常说:「There's a big opportunity cost of just indecision, and you're constantly paying interest on decisions that you don't make.」每一个没拿到的数据,都是未来模型欠下的利息。
从标注工具到物理AI的底层水管
Encord最初的产品,说起来其实很「无聊」:一个能做视频、图像、3D点云标注的SaaS工具。Ulrich回忆,「我们做的,是把数据流从机器人公司拉出来,让人类和AI一起标注,再推回去让模型训练。」
但很快,他们发现单靠标注远远不够。机器人公司需要的不只是干净数据,更需要一个能让算法和工程师协作迭代的场地。Encord在湾区设立了R&D设施,自己不造机器人,却为所有客户造了个「训练场」——客户把数据丢进来,可以自动检测异常、分发标注、评估模型表现,形成正向循环。
Eric喜欢用「水管」来形容他们的角色:不造马桶,不造自来水厂,但负责把水送到每个家庭。
没想到,这种朴素的基础设施思路,反而成了机器人时代不可或缺的地基。如今,Encord的客户名单里,有丰田、欧洲的自动驾驶初创公司,还有做仓库自动化的机器人厂商。全世界300多家AI团队在用这根「水管」连接数据和模型。
洗衣折叠机器人与数据飞轮
湾区有家公司,名字很朴素:「a robotics」。他们的梦想,是让每个家庭都用得起能折叠衣服的机器人。
但现实很骨感。折叠衣服看起来简单,实际是个数据炼狱。每条牛仔裤、每件T恤、每一块毛巾,质地、颜色、褶皱千变万化。机器人要学会分辨衣物、判断材质、手指如何抓取、怎么对折、如何叠放,每一步都要有真实的数据喂给模型。
起初,他们的工程师靠手工标注:一天最多处理几百条视频。训练出来的模型,总会在遇到新款睡衣时「出神」,不是把袖子塞进裤腿,就是干脆把毛巾卷成一团。
然而,接入Encord的数据平台之后,情况开始转变。系统能自动检测标注异常,把难懂的样本优先推给资深标注员,还能让模型自己「打分」哪些场景没见过,快速补充数据。数据飞轮开始转动——每一块被正确折叠的衬衫,都变成了下一次更好的训练素材。
「数据飞轮」这词本来是互联网的口号,但在物理AI世界里,它变成了血肉之躯。
人类:异常的守夜人
「你们是要让人类失业吗?」
Eric听过这样的问题太多次了。他总是摇头。「其实,最关键的环节,还是人类。」
现实世界里,标注永远不可能100%自动化。每次遇到异常情况,比如突发的衣服沾上油渍、机器手指突然打滑,只有经验丰富的人工标注师,才能判断这是不是模型的bug,还是数据源的问题。
有时候,机器人遇到新问题,模型会给出奇怪的分数。这时候,人类要介入,快速分析,补充数据,重新训练。正是这些「异常处理」的能力,让数据飞轮不至于失控。
Ulrich说得很直白:「A model is only as good as the data it's trained on.」而数据的最后一环,总握在人类手里。语言模型的错误,最多是个令人哑然的段子;但物理AI的幻觉,可能是一架从天上坠落的无人机。两者的容错空间,根本不在同一个量级。
狂风暴雨里的小船
Eric喜欢讲一个比喻:「You're in a rowboat on a very stormy ocean, and you see an island very far away...you don't want to go straight into the island cuz you might hit a wave, and you might capsize.」
这像极了他们这几年的创业路。机器人世界正在起风,每一波技术浪潮都可能把小公司掀翻。但他们的做法不是冲得最快,而是每划一下桨,都看清风向,避开最大的涌浪。
Encord没有造机器人,也没有去追逐硅谷的泡沫。他们造了一根最无聊、却最坚固的水管。等到暴风雨过去,机器人们还在练习叠衣服、开车、巡检……这些水下的数据流,才是未来一切物理AI的真正动力。
刚完成6000万美元C轮融资的Encord,如今手握来自全球300家AI团队的数据,正向着「每一条物理AI数据都流经我们系统」的愿景划去。就像Stripe用水管连通了全球每一笔金融交易,Encord想做的,是物理世界的那根管。
那位当年投了冰岛约会应用的投资人,或许已经忘了那杯酒。但在风雨中坚持划桨的人,始终记得远方的岛屿。
关键金句
- 「物理AI的痛点不是芯片算力,而是现实世界的脏数据。」
- 「一只折叠毛巾的手臂,比一万张猫图更难训练。」
- 「模型的幻觉在网络是趣事,在现实里却是灾难——那是一架从天上坠落的无人机。」
- 「水管永远不性感,但断了水,全世界都得停摆。」
- 「每一块被折叠的衬衫,都是数据飞轮的一次转动。」
