硬件测试还在用 PowerPoint 做报告,这不是笑话。
在航空航天公司的测试实验室里,工程师们每天重复同一套流程:从公司共享硬盘下载测试数据到本地电脑,用 MATLAB 或 Python 跑自己写的分析脚本,得出结论后截图粘贴到 PowerPoint 里。航电工程师看航电参数,GNC 工程师盯制导数据,热控工程师查温度曲线,三拨人分头作业,可能在分析同一次飞行测试,但彼此看不到对方的结果。最后开评审会时,大家拿着各自的 PPT 文件,试图拼凑出系统的完整画面。
Nominal 联合创始人 Cameron McCord 把这种状态称为「PowerPoint 工程学」,而且直言这依然是行业的尖端水平。
这听起来像是某个落后小作坊的故事,但实际情况是,美国五大防务承包商中有四家都在用这套流程。问题的根源不在工程师的能力,而在基础设施。过去二十年里,软件开发已经完成了从本地版本管理到 GitHub 的跃迁,有了 CI/CD 和 DevOps 的完整工具链,测试问题基本解决。但硬件工程师还困在 2003 年。
物理世界比代码世界复杂得多。
一架无人机的飞行测试涉及数百人协作,飞机上可能装着一万个传感器,每个传感器每秒产生一百万个数据点。测试进行时,有人坐在机舱里操作,地面团队监控遥测数据,事后还要做长达数月的分析。这跟跑单元测试完全是两回事,每次测试都是「生产级」的事件。
然而支撑这些关键任务的数据基础设施,竟然是网络附加存储加上工程师的本地硬盘。
数据默认存在局部,云端几乎不存在。当 Jason Hoch 描述这个场景时,他的语气里带着难以置信:工程师要做的第一件事是把几百 GB 的数据从中央驱动器下载到笔记本电脑上,然后才能开始工作。
Nominal 要做的,就是把硬件测试从 2003 年拉到 2020 年,然后继续往前推。
他们的核心产品叫 Nominal Core,就是硬件测试的数据平台和系统记录。所有测试数据集中存储在云端,通过语义层进行结构化标注——什么测试、什么系统、什么时间、什么条件,全部可追溯。工程师不再各自为战,而是在统一平台上协作。更关键的是,在 Nominal 里编写的验证逻辑(他们叫 checklist)可以版本控制,可以部署到不同环节。
想象一下这个场景:研发团队在实验室测试时,在 Nominal 里定义了一套验证规则,用来判断电池子系统是否正常工作。这套规则不是写完就丢到某个文档里,而是变成了可执行的代码逻辑。当产品进入制造阶段,这套规则自动部署到生产线的质量检测环节,每一件下线产品都要跑一遍。当设备交付到客户手中开始运行,同样的验证逻辑还可以部署到边缘设备上,实时监控系统状态。
从 R&D 到制造到运维,同一套逻辑贯穿始终。
这就是 Nominal 说的「持续硬件测试」。
但真正反常识的部分还在后面。大部分人会觉得,AI 越发达,硬件开发就应该越依赖仿真,测试需求会减少。Cameron 的判断完全相反。他认为我们正在进入一个硬件测试需求激增的时期,因为人类开始意识到,我们对物理系统的理解其实很浅薄,数据积累严重不足。
「物理世界会投票。」
这是 Cameron 反复强调的一句话。仿真可以做很多事情,但物理规律永远有最终决定权。SpaceX、Anduril、特斯拉这些公司证明了,如果你在测试基础设施上投入资源,就能获得巨大的竞争优势。而现在的趋势是,越来越多的硬件系统开始搭载 AI 模型,训练这些模型需要海量的高质量数据。
Nominal 的一个客户在训练机械臂的时候发现,如果物理组件本身有问题——比如伺服电机偏移、传感器未校准——收集到的数据就全是脏数据。Nominal 在后台自动检测异常,标记出哪些时间段的数据可以放心用来训练模型,哪些必须丢弃。
这只是爬行阶段。
但真正激进的实验还在更前沿。Nominal 正在跟美国空军和 DARPA 合作一个叫 CIPHER 的项目,全称是「实时执行的信息物理系统」。传统的硬件测试是巨大的矩阵,每个离散的测试点都要满足,测试团队按顺序一个个烧掉。CIPHER 的目标是让 AI 智能体配合数字孪生,在快于实时的速度下推荐下一个最大化知识增益的测试条件。
不是飞一次、落地、看数据、确认通过、再飞,而是在飞行过程中持续调整,把离散矩阵变成连续的梯度曲线。
这需要测试基础设施跟上。如果数据还散落在各个工程师的笔记本电脑里,这些都做不到。
Jason 提到了一个更长远的愿景。在软件开发领域,编码智能体之所以进化得这么快,是因为代码可验证,学习循环可以高速运转。如果硬件领域也能建立起类似的验证基础设施,就可以实现「硬件的单元测试」。到那时,AI 设计智能体才真正有了反馈回路。
但在此之前,得先解决数据收集、数据清洗、数据标准化这些基础问题。
这正是 Nominal 在做的事情。Cameron 的目标是把硬件测试的人效比彻底翻转:从 50 个人测试一个系统,变成一个人管理 50 个系统。工程师通过 AI 工具在 Nominal 平台上工作,验证逻辑自动部署到多个项目,异常检测智能体 24 小时监控所有运行中的设备。
Cameron 给了一个有趣的类比。如果有 AGI 帮你孩子设计一个电子游戏,你可能不会要求严格测试就让孩子玩。但如果 AGI 要给你孩子造一个玩具,你一定会非常小心地确认它在物理上是安全的。
因为物理世界是我们生活的地方。
