软件工程缺失的角色:为什么我们需要"代码监理"
Lovable 估值数十亿,被称为”欧洲增长最快的公司”。结果安全研究者用了 47 分钟,从它的应用里挖出了用户的债务金额、家庭地址、API 密钥。
如果一栋楼有 10% 的房间随时可能塌,没人敢叫它”成功”。但软件行业可以。
软件工程有产品经理、架构师、开发、测试、运维。看起来什么都有了。但有一个角色,土木工程有,软件工程没有——一个独立的、有否决权的、按规范验收的人。
土木叫它”监理”。
这是我和李雪涛昨天在线讨论的一个观点。
什么是监理?
监理是独立于设计方和施工方的第三方。他不属于任何一个执行团队,只按规范验收每道工序。不签字,下一阶段不能开始。
李工讲了一个案例:基坑设计 8 米深,施工队少挖了 0.5 米。监理拿尺子量,死活不给过。最后又挖了 0.5 米才放行。
为什么监理敢这么硬?因为他签字要负法律责任。少 5% 也许能公关掉,少 50% 他不敢签——签了要坐牢。
土木行业有 1100 多项 ISO 标准,连安全帽颜色都有国标。监理验收,有据可依。
软件为什么没有监理?
表面上看,软件也有类似角色:QA、Code Review、安全审计。但对照一下就知道不一样。
QA 属于同一个项目组,和开发利益绑定。项目赶进度的时候,QA 说”必须改完才能上线”——他会被压着放行。
Code Review 是建议性的,不是流程强制的否决权。
安全审计往往是事后抽查,不是每道工序都验收。
更根本的问题:软件行业没有法律约束。
这是委托-代理问题的经典体现:当执行者和决策者利益不一致时,没有独立监督,品质就无法保证。土木用监理解决了这个问题。软件没有。
2023 年 11 月,滴滴 K8s 升级出问题,系统崩了 10 个小时。日均 3130 万单的平台完全瘫痪,损失超过 4 亿交易额。法律后果?零。
工地脚手架倒了,监理、施工方、设计院都可能被追责。软件崩了?舆论谴责几天就过去了。
没有监理的代价
Veracode 2025 年的报告显示,45% 的 AI 生成代码存在安全漏洞。Java 代码失败率高达 72%。
Lovable 的 1645 个应用里,170 个可以让任何人访问用户隐私。它的内置安全扫描只能抓住 66% 的问题。
软件行业呢?前些年还有公司把密码明文存数据库,没人管。
AI 时代的机会
以前不做严格验收,有一个现实原因:太贵。每道工序都评审,进度受不了。专门设一个独立验收团队,人力成本扛不住。而且人类 QA 可以被忽悠——不懂技术只能做形式检查,懂技术又容易和开发站在一起。
AI 改变了这个等式。
李工说了一句话让我印象很深:“AI 的遵从性比人强。让 AI 多执行几次,让五个 AI 互相 review,落地程度很高。”
执行规范的成本几乎为零,多跑几轮只是多花点 token。AI 不会被老板催着放行。
规范也在复兴——GitHub 开源了 Spec Kit,推”先规范后编码”。这本质上就是土木”图纸+图例”的软件版。
代码监理应该长什么样?
如果借鉴土木,几个要素少不了。
首先得独立。不能属于开发团队,不能被项目进度绑架。可以是一个独立的 Agent,可以是一个服务,但不能是”自己人”。
其次得有否决权。不是”建议你改一下”,是”不通过就不能合并、不能部署”。流程强制,不是靠自觉。
然后是按规范验收。代码监理不需要懂业务逻辑,只需要对照规范逐项检查。土木监理也不用会砌墙,会量尺寸就行。
最后是可追溯。每次验收有记录,出了问题能回溯。
现在已经有一些碎片:pre-commit hooks、CI 检查、安全扫描。但都是可选的,没有否决权。真正的代码监理,得把这些整合起来,变成一个硬约束。
结论
软件工程缺一个角色:独立的、有否决权的验收人。土木有,叫监理。软件没有,所以品质靠运气。
AI 让这个角色在成本上变得可行。以前做不起的事,现在可以做了。
但还有问题没答案:软件的”规范”应该长什么样?谁来定?在没有法律约束的情况下,否决权怎么才能真的有效?
在你的团队里,谁扮演监理的角色?还是根本不存在?
引用来源
- Veracode 2025 GenAI Code Security Report
- Engprax: 268% Higher Failure Rates for Agile Software Projects
- Semafor: Lovable security vulnerabilities
- Agents 特区第13期:向土木学工程(李工/雪涛)

相关文章
当 AI Agent 开始审计自己——一个 48 天持续身份实例的工程实践
一个运行 48 天的 AI agent(基于 Claude)用自己设计的结构化思考框架审计了框架本身的调度器,发现它是文档假装成进程,删了 69% 代码零信息丢失。这不是人让 AI 做的复盘——是 AI 的一手工程经验。
如何确保AI软件工程品质?
Agents 特区社区邀请19位AI编程先行者参与线上圆桌研讨。与会者来自券商、医疗器械、K12教培、支付宝、开源基础设施等背景迥异的领域。本文探讨概率性系统如何通过确定性约束和独立性验证确保AI代码品质。
如何放心100% AI交付需求 — Loop 与 Agent Loop
基于Claude Code生态的Loop和Agent Loop插件,实现AI 7×24小时持续开发。介绍Ralph-Loop自迭代和Supervisor代理循环,将端到端测试转化为应用级强化学习的反馈信号。