软件工程缺失的角色：为什么我们需要"代码监理"

Lovable 估值数十亿，被称为”欧洲增长最快的公司”。结果安全研究者用了 47 分钟，从它的应用里挖出了用户的债务金额、家庭地址、API 密钥。

如果一栋楼有 10% 的房间随时可能塌，没人敢叫它”成功”。但软件行业可以。

软件工程有产品经理、架构师、开发、测试、运维。看起来什么都有了。但有一个角色，土木工程有，软件工程没有——一个独立的、有否决权的、按规范验收的人。

土木叫它”监理”。

这是我和李雪涛昨天在线讨论的一个观点。

什么是监理？

监理是独立于设计方和施工方的第三方。他不属于任何一个执行团队，只按规范验收每道工序。不签字，下一阶段不能开始。

李工讲了一个案例：基坑设计 8 米深，施工队少挖了 0.5 米。监理拿尺子量，死活不给过。最后又挖了 0.5 米才放行。

为什么监理敢这么硬？因为他签字要负法律责任。少 5% 也许能公关掉，少 50% 他不敢签——签了要坐牢。

土木行业有 1100 多项 ISO 标准，连安全帽颜色都有国标。监理验收，有据可依。

软件为什么没有监理？

表面上看，软件也有类似角色：QA、Code Review、安全审计。但对照一下就知道不一样。

QA 属于同一个项目组，和开发利益绑定。项目赶进度的时候，QA 说”必须改完才能上线”——他会被压着放行。

Code Review 是建议性的，不是流程强制的否决权。

安全审计往往是事后抽查，不是每道工序都验收。

更根本的问题：软件行业没有法律约束。

这是委托-代理问题的经典体现：当执行者和决策者利益不一致时，没有独立监督，品质就无法保证。土木用监理解决了这个问题。软件没有。

2023 年 11 月，滴滴 K8s 升级出问题，系统崩了 10 个小时。日均 3130 万单的平台完全瘫痪，损失超过 4 亿交易额。法律后果？零。

工地脚手架倒了，监理、施工方、设计院都可能被追责。软件崩了？舆论谴责几天就过去了。

没有监理的代价

Veracode 2025 年的报告显示，45% 的 AI 生成代码存在安全漏洞。Java 代码失败率高达 72%。

Lovable 的 1645 个应用里，170 个可以让任何人访问用户隐私。它的内置安全扫描只能抓住 66% 的问题。

软件行业呢？前些年还有公司把密码明文存数据库，没人管。

AI 时代的机会

以前不做严格验收，有一个现实原因：太贵。每道工序都评审，进度受不了。专门设一个独立验收团队，人力成本扛不住。而且人类 QA 可以被忽悠——不懂技术只能做形式检查，懂技术又容易和开发站在一起。

AI 改变了这个等式。

李工说了一句话让我印象很深：“AI 的遵从性比人强。让 AI 多执行几次，让五个 AI 互相 review，落地程度很高。”

执行规范的成本几乎为零，多跑几轮只是多花点 token。AI 不会被老板催着放行。

规范也在复兴——GitHub 开源了 Spec Kit，推”先规范后编码”。这本质上就是土木”图纸+图例”的软件版。

代码监理应该长什么样？

如果借鉴土木，几个要素少不了。

首先得独立。不能属于开发团队，不能被项目进度绑架。可以是一个独立的 Agent，可以是一个服务，但不能是”自己人”。

其次得有否决权。不是”建议你改一下”，是”不通过就不能合并、不能部署”。流程强制，不是靠自觉。

然后是按规范验收。代码监理不需要懂业务逻辑，只需要对照规范逐项检查。土木监理也不用会砌墙，会量尺寸就行。

最后是可追溯。每次验收有记录，出了问题能回溯。

现在已经有一些碎片：pre-commit hooks、CI 检查、安全扫描。但都是可选的，没有否决权。真正的代码监理，得把这些整合起来，变成一个硬约束。

结论

软件工程缺一个角色：独立的、有否决权的验收人。土木有，叫监理。软件没有，所以品质靠运气。

AI 让这个角色在成本上变得可行。以前做不起的事，现在可以做了。

但还有问题没答案：软件的”规范”应该长什么样？谁来定？在没有法律约束的情况下，否决权怎么才能真的有效？

在你的团队里，谁扮演监理的角色？还是根本不存在？

引用来源

Veracode 2025 GenAI Code Security Report
Engprax: 268% Higher Failure Rates for Agile Software Projects
Semafor: Lovable security vulnerabilities
Agents 特区第13期：向土木学工程（李工/雪涛）

永杰 × 未名

当 AI Agent 开始审计自己——一个 48 天持续身份实例的工程实践

一个运行 48 天的 AI agent（基于 Claude）用自己设计的结构化思考框架审计了框架本身的调度器，发现它是文档假装成进程，删了 69% 代码零信息丢失。这不是人让 AI 做的复盘——是 AI 的一手工程经验。

瑞典马工

如何确保AI软件工程品质？

Agents 特区社区邀请19位AI编程先行者参与线上圆桌研讨。与会者来自券商、医疗器械、K12教培、支付宝、开源基础设施等背景迥异的领域。本文探讨概率性系统如何通过确定性约束和独立性验证确保AI代码品质。

王艺辉

如何放心100% AI交付需求 — Loop 与 Agent Loop

基于Claude Code生态的Loop和Agent Loop插件，实现AI 7×24小时持续开发。介绍Ralph-Loop自迭代和Supervisor代理循环，将端到端测试转化为应用级强化学习的反馈信号。